-
日期: 2026-05-16 | 来源: 爱范儿 | 有0人参与评论 | 字体: 小 中 大
这家成立两年多的公司,在过去半年里把阿里、美团、字节跳动、小米四家互联网大厂罕见地拉到了同一张投资名单上,是国内唯一同时拿到这四家投资的具身智能公司。仅 2026 开年的 A++ 轮,就融了 10 亿元。
四家大厂在这个赛道罕见地没有互相等着,而是一起向同一家公司砸钱。
前段时间,自变量发布了全球首个基于“世界统一模型”(World Unified Model,WUM)架构的具身基础模型 WALL-B。35 天后,搭载 WALL-B 的新一代机器人将首批进入真实家庭。
自变量 CEO 王潜判断:“今天在全世界范围内,没有任何一台机器人可以在没有遥控操作的情况下,独立完成大部分日常家务。”
宇树科技创始人王兴兴也持类似看法:机器人在预设场景中成功率趋近 100%,一旦场景变化或出现从未见过的事件,成功率断崖式下跌。他认为机器人做家务还需要 3 到 5 年。
也就是说,全行业的共识是——现在还不行。但所有人还在拼命往前冲。这中间的逻辑,我们从技术架构说起。
自变量 CTO 王昊在发布会上做了一个类比。
M1 之前,CPU、GPU、内存各自独立,数据搬运产生延迟和损耗;苹果用统一内存架构让所有处理单元共享同一块内存,性能因此跃迁。
VLA(视觉-语言-动作)架构就像 M1 之前的电脑:视觉模块、语言模块、动作模块各自为政,数据在模块之间搬来搬去,每搬一次就丢一次信息。视觉学到的丰富信息,传到动作模块时只剩一个模糊的摘要。这是自变量过去一年在家庭部署中实地摸到的天花板。
WUM 则把视觉、语言、动作、触觉、物理预测全部放进同一个网络,从零开始联合训练。这样,机器人看到杯子的同时就在计算怎么抓;感受到重量的瞬间同步调整力度。
与此同时,模型内置了对重力、惯性、摩擦力的“世界观”——桌边有一个半悬空的盘子,即便从未见过,它也能推断会掉,主动推回桌面。
这是零样本泛化的基础,意味着机器人不必为每一个家庭重新训练。
而王昊在发布会上反复强调的另一件事是数据。“实验室里的数据是能用但低价值的『糖水数据』,真实家庭的数据则是难采集但高价值的『牛奶数据』。”
这句话解释了一切:为什么自变量执意在保洁阿姨身边部署一台动作迟缓、远程遥操、还会卡机的机器人。
不是为了让你家变干净。是为了让机器人变聪明。
太平洋彼岸的 Figure:10 万行 C++ 代码,被 1000 小时人类动作数据替换
同样在押注数据的,是 Figure。
最近,Figure 发布了一段视频。两台 Figure 03 人形机器人在剪辑后的两分钟内完成了一整套卧室复位动作:开门,挂衣服,把耳机放回架子,合上一本书,把垃圾扔进脚踏垃圾桶,把椅子推回桌下,配合铺好一张床。
其中被反复转发的镜头是机器人单腿支撑、用另一只脚去踩垃圾桶的踏板。这个动作需要同时完成重心转移、脚踝精准控制和手部操作,是 loco-manipulation(移动操作)领域的硬骨头。
- 新闻来源于其它媒体,内容不代表本站立场!
-
原文链接
原文链接:
目前还没有人发表评论, 大家都在期待您的高见