我相信这个方法是有效的。如果我们有不同的虚拟世界(包括游戏世界)和一个能够在所有这些世界中掌握不同技能的代理,那么现实世界只是更大分布的一部分。 Stephanie Zhan 可以跟大家分享一下Dr. Stephanie Zhan 的项目吗?尤里卡?吉姆·范肯定是。在该项目中,博士。 Eureka我们仍然使用LLM作为基于Eureka结果的机器人开发人员。 LLM 编写指定模拟参数的代码,例如域随机化参数。经过几次迭代,我们在模拟中训练的策略被推广到现实世界。
我们展示的一个具体例 丹麦手机号码列表 子是,我们有一只机器狗,它在瑜伽球上行走,不仅能够保持平衡,还能向前行走。有人用他真正的狗尝试这项任务并发现他的狗可以做到这一点,有一个非常有趣的评论。所以我们的神经网络在某种程度上胜过“真正的狗”。 Sonia Huang 我很确定我的狗做不到这一点,哈哈。 Jim Fan 是的,犬类人工智能(ADI),这是下一本冒险书的主题。 Sonia Huang 在虚拟世界领域,最近出现了很多令人惊叹的模型D和视频生成,其中很多都是基于变形金刚。
您认为我们已经达到可以通过这些架构实现预期目标的阶段了吗?或者您认为模型的架构还需要一些发现? Jim Fan 是的,我认为我们在基本机器人模型方面还没有达到 Transformer 架构的全部极限。目前最大的瓶颈是数据问题。正如我之前提到的,我们无法从互联网上下载机器人控制的数据。我们必须通过模拟或真实的机器人来收集这些数据。一旦我们有了成熟的数据管道,我们就可以对这些数据进行标记并将其输入 Transformer 进行压缩,就像 Transformer 预测维基百科上的下一个单词一样。