149元叫了个保洁来了三个人和一台机器人超值

日期: 2026-05-16 | 来源: 爱范儿 | 有0人参与评论 | 字体: 小中大
这家成立两年多的公司，在过去半年里把阿里、美团、字节跳动、小米四家互联网大厂罕见地拉到了同一张投资名单上，是国内唯一同时拿到这四家投资的具身智能公司。仅 2026 开年的 A++ 轮，就融了 10 亿元。

四家大厂在这个赛道罕见地没有互相等着，而是一起向同一家公司砸钱。

前段时间，自变量发布了全球首个基于“世界统一模型”（World Unified Model，WUM）架构的具身基础模型 WALL-B。35 天后，搭载 WALL-B 的新一代机器人将首批进入真实家庭。

自变量 CEO 王潜判断：“今天在全世界范围内，没有任何一台机器人可以在没有遥控操作的情况下，独立完成大部分日常家务。”

宇树科技创始人王兴兴也持类似看法：机器人在预设场景中成功率趋近 100%，一旦场景变化或出现从未见过的事件，成功率断崖式下跌。他认为机器人做家务还需要 3 到 5 年。

也就是说，全行业的共识是——现在还不行。但所有人还在拼命往前冲。这中间的逻辑，我们从技术架构说起。

自变量 CTO 王昊在发布会上做了一个类比。

M1 之前，CPU、GPU、内存各自独立，数据搬运产生延迟和损耗；苹果用统一内存架构让所有处理单元共享同一块内存，性能因此跃迁。

VLA（视觉-语言-动作）架构就像 M1 之前的电脑：视觉模块、语言模块、动作模块各自为政，数据在模块之间搬来搬去，每搬一次就丢一次信息。视觉学到的丰富信息，传到动作模块时只剩一个模糊的摘要。这是自变量过去一年在家庭部署中实地摸到的天花板。

WUM 则把视觉、语言、动作、触觉、物理预测全部放进同一个网络，从零开始联合训练。这样，机器人看到杯子的同时就在计算怎么抓；感受到重量的瞬间同步调整力度。

与此同时，模型内置了对重力、惯性、摩擦力的“世界观”——桌边有一个半悬空的盘子，即便从未见过，它也能推断会掉，主动推回桌面。

这是零样本泛化的基础，意味着机器人不必为每一个家庭重新训练。

而王昊在发布会上反复强调的另一件事是数据。“实验室里的数据是能用但低价值的『糖水数据』，真实家庭的数据则是难采集但高价值的『牛奶数据』。”

这句话解释了一切：为什么自变量执意在保洁阿姨身边部署一台动作迟缓、远程遥操、还会卡机的机器人。

不是为了让你家变干净。是为了让机器人变聪明。

太平洋彼岸的 Figure：10 万行 C++ 代码，被 1000 小时人类动作数据替换

同样在押注数据的，是 Figure。

最近，Figure 发布了一段视频。两台 Figure 03 人形机器人在剪辑后的两分钟内完成了一整套卧室复位动作：开门，挂衣服，把耳机放回架子，合上一本书，把垃圾扔进脚踏垃圾桶，把椅子推回桌下，配合铺好一张床。

其中被反复转发的镜头是机器人单腿支撑、用另一只脚去踩垃圾桶的踏板。这个动作需要同时完成重心转移、脚踝精准控制和手部操作，是 loco-manipulation（移动操作）领域的硬骨头。
- 新闻来源于其它媒体，内容不代表本站立场！
原文链接
原文链接:

在此页中阅读全文

我们的赞助商

目前还没有人发表评论, 大家都在期待您的高见

发表评论