全球首个OpenAI机器人诞生，碾压擎天柱，10亿机器人大军正式启动

日期：2024-12-25 作者：hzhangbo 移动：http://mip.riyuangf.com/mobile/quote/11518.html

新智元报道

编辑：Aeneas 润

【新智元导读】OpenAI上一笔融资不到八个月，Figure就来交卷了！这个机器人能说会动，还能自主推理，给自己布置任务。最炸裂的是，它完全是自主行动，没有远程控制！1.0倍速的原视频一出，网友们震惊了。

世界上第一个「ChatGPT机器人」来了！

初创公司Figure联合OpenAI，现在直接给LLM造了个身体（具体来说，它是个OpenAI训练的多模态大模型）。

半个月前刚获得OpenAI等的6.75亿美元融资，今天初创公司Figure就来交卷了，简直神速。

这个名为Figure 01的机器人，充分展示了和人类以及环境交互的能力。它会说会看，还能给人类递食物、捡垃圾、收拾碗筷。

这段视频可谓亮点满满。

首先，视频是1.0倍原速拍摄的，而且是连续拍摄，跟之前那些为了表现流畅而加速的人形机器人演示不一样。

其次，整个视频只了一个端到端的神经网络。

并且，机器人背后，并没有人在远程操作，所有动作都是由机器人自行完成的！

视频中的小哥问它：「Figure 01，你看到了什么？」

Figure 01回答：「当然！」然后抬起手，拿起一个苹果递给他。

下面，更高能的来了！

小哥直接把一堆垃圾哗啦啦倒在Figure 1面前，然后问它，你能不能一边给我解释下刚才为什么会这么做的原因，一边把这些垃圾收拾干净呢？

Figure 01自信满满地表示：像桌上这些盘子啊杯子啊，应该放到旁边的沥水架上。

小哥表示，那你就帮忙放一下吧？五秒后，Figure 01抬起右手，用敏捷灵活的动作，一个一个地把盘子和杯子放到了该放的地方。

最后，小哥还让Figure 01给自己的表现来个复盘：「你觉得你表现得如何？」

Figure 01很满意地说：「我觉得我做得很好，我把苹果递给了你，把垃圾丢掉了，桌上的东西也都放到了该放的地方。」

看到这一幕的网友们，纷纷表示惊叹。

和OpenAI的首次合作亮相，就如此惊艳。

显然，在机器人领域，人工智能时代才刚刚开始。

OpenAI的产品与合作副总裁Peter Welinder表示："我们一直计划重返机器人领域，我们看到了与Figure合作的价值。我们想探索，在高性能的多模态模型驱动下，人形机器人能实现什么样的目标。」

如今，人形机器人再次引起了投资者兴趣，因为大模型驱动的软件，为机器人与人类的互动提供了更多可能性。

特斯拉CEO马斯克预测，在2040年，地球上将出现10亿个人形机器人。

创始人亲自下场解释原理

话说回来，被看Figure 01的这些操作看似容易，背后可是满满的玄机。

- 描述它看到的一切情况

- 规划未来的行动

- 思考输入的视觉和文字信息

- 语音输出它的推理结果

放出的这个视频中，所有的行为都是学习的（不是远程操作的），并且没有加速播放。

同时模型还负责规划机器人运行哪些学习的闭环行为来完成给定的命令，将特定的神经网络权重加载到GPU上并执行策略。

将Figure 01连接到完成预训练的多模态模型，为其提供了一些有趣的新功能。

Figure 01在OpenAI的大模型的加持下可以做到：

- 描述机器人周围的环境；

- 决策时使用常识推理。比如，「餐桌上的盘子和杯子很可能之后要放到烘干架上」；

- 把「我饿了」这样模棱两可的高层次请求转化为「递给对方一个苹果」等与具体情况相适应的行为；

1）将杯子放在晾衣架上；

2）将盘子放在晾衣架上。

所有行为均由神经网络视觉运动Transformer进行策略驱动，将像素直接映射到动作。

神经网络以10hz的频率接收机器人拍到的图像，并以200hz的频率生成 24-DOF动作（手腕姿势和手指关节角度）。

这些动作作为高速「锚点（setpoints）」，供更高速率的全身控制器跟踪。

不同的部分各司其职：

- 云端的预训练模型对图像和文本进行常识推理，以得出高级规划；

- 学习的视觉运动策略执行规划，执行难以手动指定的快速反应行为，例如把一个袋子折叠成任何需要的形状；

Figure创始人：绝不把人形机器人用于军事

半个月前，这个消息就在AI圈内传开了——

人形机器人初创公司Figure，获得了OpenAI等公司的6.75亿美元融资！

参与融资的其他公司，包括OpenAI创业基金、亚马逊工业创新基金、Parkway风投公司、英特尔投资公司、Align风投公司和ARK投资公司。

OpenAI给Figure投钱，当然也是想下一盘大棋。

Figure的创始人兼首席执行官Brett Adcock表示，公司将利用这笔资金开发用于机器人技术的大型语言模型，扩大生产规模，并雇佣更多员工。

现在，Figure的演示已经显示了，他们在人形通用机器人的交互上，做出了重大飞跃的产品。

史上第一次，机器人在没有操控的情况下，和人如此自然地互动，并且能够服从人类。如此流畅的演示，此前的公司都没有做到。

当然，Figure 01目前只是一个原型，如果要进行商业部署，出售给企业，会需要更多的工作。

现在，随着LLM的进步，全世界机器人都疯狂开卷了！

除了特斯拉的擎天柱Optimus，与亚马逊合作的人形机器人初创公司Agility，还有刚挖来前Optimus科学家领导开源机器人项目的Hugging Face，以及昨天刚成立的初创公司Physical Intelligence。

「青春版马斯克」帮人类连接天网

当时，他成立了Vettery——一个在线猎头平台，不到一年的时间团队迅速发展到数百名员工，客户网络扩大到30000家招聘公司。

Vettery人工智能系统每月匹配20000次面试，帮助数千人找到他们梦想的工作。

他白手起家，10年间成立的3家公司，分别达成了「亿元卖身」，「纽交所上市」，「2年成长为独角兽」3大成就，实在是令人咋舌。

而且纵观他成立的3家公司的过程和所涉及的行业，和前世界首富马斯克颇有相似之处。

而现在他的Figure AI更是直接与特斯拉的展开了竞争。

参考资料：

https://twitter.com/figure_robot/status/1767913661253984474

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

点赞 0举报收藏 0评论 0

0 条相关评论

相关最新动态

推荐最新动态

点击排行