OpenAI大模型上身机器人,原速演示炸场(图)

日期: 2024-03-13 | 来源: 量子位 | 有0人参与评论 | 字体: 小中大
它还能规划动作、有短期记忆能力、用语言解释它的推理过程。

比如对话里说“你能把它们放在那里吗？”

“它们”、“那里”这种模糊表述的理解，就体现了机器人的短期记忆能力。

它使用了OpenAI训练的视觉语言模型，机器人摄像头会以10Hz拍下画面，然后神经网络将以200Hz输出24自由度动作（手腕+手指关节角度）。

具体分工上，机器人的策略也很像人类。

复杂动作交给AI大模型，预训练模型会对图像和文本进行常识推理，给出动作计划；

简单动作如抓起塑料袋（抓哪里都可以），机器人基于已学习的视觉-动作执行策略，可以做出一些“下意识”的快速反应行动。

同时全身控制器会负责保持机身平衡、运动稳定。

机器人的语音能力则基于一个文本-语音大模型微调而来。

除了最先进的AI模型，Figure 01背后公司——Figure的创始人兼CEO还在推文中提到，Figure方面整合了机器人的所有关键组成。

包括电机、中间件操作系统、传感器、机械结构等，均由Figure工程师设计。

据了解，这家机器人初创公司在2周前才正式宣布和OpenAI的合作，但才13天后就带来如此重磅成果。不少人都开始期待后续合作了。

由此，具身智能领域又有一颗新星走到了聚光灯下。

“将人形机器人带进生活”

说到Figure，这家公司创立于2022年，正如前文所言，再次引爆外界关注，就在十几天前——

官宣在新一轮融资中筹集6.75亿美元，估值冲到26亿美元，投资方几乎要集齐半个硅谷，包括微软、OpenAI、英伟达和亚马逊创始人贝佐斯等等。
- 新闻来源于其它媒体，内容不代表本站立场！
原文链接
原文链接:

在此页中阅读全文

我们的赞助商

目前还没有人发表评论, 大家都在期待您的高见

发表评论