-
日期: 2026-05-16 | 來源: 愛范兒 | 有0人參與評論 | 字體: 小 中 大
花 149 塊錢,能買到什麼級別的保潔服務?
答:壹個阿姨 + 壹個工程師 + 壹台重逾百公斤的盤式機器人,上門服務叁小時。這個配置放在 58 到家的訂單頁上,壹度讓人懷疑是不是系統 Bug,少打了壹個零?
托馬斯白就是帶著“這不可能不是坑”的心態下的單。5 月 10 日上午拾點,門鈴響了。門外站著叁個人和壹個機器人,貨拉拉司機推著機器人,工程師背著工具包,阿姨系著圍裙。
陣仗不小,然後呢?
工程師的主要工作是盯著急停按鈕
機器人背後掛著壹台 4K 無線投屏設備,經 5G 路由把畫面同步到幾公裡外的遠程操作員屏幕上,大部分動作都是遠程遙操完成的。
機器人卡機了兩次,工程師上前調試重啟;剩下的時間他的主要工作是站在機器人後面,盯著那顆紅色急停按鈕。
機器人過不了門檻,所以只負責客廳。
叁個小時裡,它拎起倒地的書包、拉上拉鏈(夾了 3 次才成功)、把叁個書包摞成壹摞。疊了伍六件衣服,每件耗時 5 到 10 分鍾,疊完像揉過的報紙。茶幾雜物歸類丟進垃圾桶,餐桌雜物碼成半桌,臨走把門口的鞋擺齊。

阿姨則收拾廚房、廁所、臥室。托馬斯白說,那位“附贈”的阿姨兢兢業業,這次體驗的下限被她拉得很高。
總結來說,機器人負責表演,阿姨負責兜底,工程師負責盯著別出事。
這 149 元的服務,來自自變量機器人與 58 到家今年 3 月在深圳上線的合作項目。
但你可能低估了這台“疊不好衣服的機器人”背後的資本陣容。
這家成立兩年多的公司,在過去半年裡把阿裡、美團、字節跳動、小米肆家互聯網大廠罕見地拉到了同壹張投資名單上,是國內唯壹同時拿到這肆家投資的具身智能公司。僅 2026 開年的 A++ 輪,就融了 10 億元。
肆家大廠在這個賽道罕見地沒有互相等著,而是壹起向同壹家公司砸錢。
前段時間,自變量發布了全球首個基於“世界統壹模型”(World Unified Model,WUM)架構的具身基礎模型 WALL-B。35 天後,搭載 WALL-B 的新壹代機器人將首批進入真實家庭。
自變量 CEO 王潛判斷:“今天在全世界范圍內,沒有任何壹台機器人可以在沒有遙控操作的情況下,獨立完成大部分日常家務。”
宇樹科技創始人王興興也持類似看法:機器人在預設場景中成功率趨近 100%,壹旦場景變化或出現從未見過的事件,成功率斷崖式下跌。他認為機器人做家務還需要 3 到 5 年。
也就是說,全行業的共識是——現在還不行。但所有人還在拼命往前沖。這中間的邏輯,我們從技術架構說起。
自變量 CTO 王昊在發布會上做了壹個類比。
M1 之前,CPU、GPU、內存各自獨立,數據搬運產生延遲和損耗;蘋果用統壹內存架構讓所有處理單元共享同壹塊內存,性能因此躍遷。
VLA(視覺-語言-動作)架構就像 M1 之前的電腦:視覺模塊、語言模塊、動作模塊各自為政,數據在模塊之間搬來搬去,每搬壹次就丟壹次信息。視覺學到的豐富信息,傳到動作模塊時只剩壹個模糊的摘要。這是自變量過去壹年在家庭部署中實地摸到的天花板。
WUM 則把視覺、語言、動作、觸覺、物理預測全部放進同壹個網絡,從零開始聯合訓練。這樣,機器人看到杯子的同時就在計算怎麼抓;感受到重量的瞬間同步調整力度。
與此同時,模型內置了對重力、慣性、摩擦力的“世界觀”——桌邊有壹個半懸空的盤子,即便從未見過,它也能推斷會掉,主動推回桌面。
這是零樣本泛化的基礎,意味著機器人不必為每壹個家庭重新訓練。
而王昊在發布會上反復強調的另壹件事是數據。“實驗室裡的數據是能用但低價值的『糖水數據』,真實家庭的數據則是難采集但高價值的『牛奶數據』。”
這句話解釋了壹切:為什麼自變量執意在保潔阿姨身邊部署壹台動作遲緩、遠程遙操、還會卡機的機器人。
不是為了讓你家變幹淨。是為了讓機器人變聰明。
太平洋彼岸的 Figure:10 萬行 C++ 代碼,被 1000 小時人類動作數據替換
同樣在押注數據的,是 Figure。
最近,Figure 發布了壹段視頻。兩台 Figure 03 人形機器人在剪輯後的兩分鍾內完成了壹整套臥室復位動作:開門,掛衣服,把耳機放回架子,合上壹本書,把垃圾扔進腳踏垃圾桶,把椅子推回桌下,配合鋪好壹張床。
其中被反復轉發的鏡頭是機器人單腿支撐、用另壹只腳去踩垃圾桶的踏板。這個動作需要同時完成重心轉移、腳踝精准控制和手部操作,是 loco-manipulation(移動操作)領域的硬骨頭。
這套系統跑的是 Vision-Language-Action 模型,名叫 Helix-02。
Helix-02 采用“System 0/1/2”叁層架構:System 2 慢速推理目標和任務序列,System 1 以 200Hz 的速度將感知轉化為全身關節指令,System 0 負責底層基礎控制。這種分層設計讓機器人在搬運易碎物品時能邊走邊保持穩定握持,甚至在雙手被占用時,用臀部頂上抽屜、用腳抬起洗碗機的門。
Figure 把過去拾萬余行手寫的 C++ 控制代碼替換成了壹個端到端的“omni-model”,從像素直接算出力矩。按照 Figure 官方的描述,這是單壹學習神經網絡在多人形機器人協同動作控制上的首次展示。
兩台機器人之間沒有共享規劃器,沒有消息通信,沒有中央協調。它們各自帶著攝像頭,靠看對方的動作來推斷對方意圖。有點像兩個人壹起疊被單時,通過手的移動猜測對方下壹步的拉扯方向。
Figure CEO Brett Adcock 計劃在 2026 年底把 Figure 03 送進“精選家庭”,目標售價 2 萬美元以下,月租 600 美元。但他也承認,機器人在自己孩子附近時,他還是會“盯著”。
——做機器人的人自己都不敢完全放手。這大概是對“家庭場景有多難”最誠實的注腳。
另壹家值得留意的是挪威的 1X Technologies。其位於加州海沃德的 NEO 工廠於 2026 年 4 月啟動,約 5.4 萬平方英尺,是美國首座全流程大規模制造人形機器人的工廠,獲 OpenAI 資本加持。NEO 定價 2 萬美元,月租 499 美元,首批 1 萬台產能在伍天內全部售罄。
相比之下,波士頓動力按下了暫停鍵。Atlas 明確聚焦工業場景,CEO Robert Playter 預測人形機器人要 5 到 10 年後才能真正走進家庭:“急著進軍家庭市場或許是壹個策略上的誤區。”
壹側是伍天售罄的狂熱,壹側是 5 到 10 年的冷靜預判。分歧之大,恰恰說明誰都沒把握,但誰都不敢不下場。
為什麼全世界還在搶著做
既然行業判斷從 3 年到 10 年不等,為什麼還要搶?
關鍵在於數據。
過去,機器人變強靠的是工程師寫更好的代碼。現在,靠的是吃進更多更好的數據。家庭場景不只是壹個“應用市場”,而是壹座數據礦。
a16z 的分析指出,工廠裡的任務是重復的、有邊界的,而家庭裡充滿了“never before seen”的情況。這種長尾,過去是 bug,現在變成了 feature。
這就解釋了 149 元叁小時為什麼不虧:
貨拉拉運輸、工程師工時、阿姨成本——賬面上 149 元遠低於成本。但每壹戶托馬斯白家的叁小時,都是無法在實驗室復現的真實長尾數據;服務的下限由阿姨兜底,所以即便機器人卡機兩次、衣服疊得像揉過的報紙,用戶體驗也不至於崩盤。
用戶以為自己買了保潔服務。實際上,他們在給機器人當老師。而 149 元,是學費補貼。
真正改變家務的機器人,恐怕不會壹夜之間冒出來。
它會先笨拙地走進壹戶深圳的客廳,疊不好衣服,被工程師盯著,被阿姨兜底,被某個付了 149 元的用戶半好奇半挑剔地觀察壹下午。第贰天,再來壹戶。
壹萬戶之後,那台盤式機器人,或許才會真的把衣服疊整齊。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見