-
日期: 2025-07-04 | 來源: 騰訊科技 | 有0人參與評論 | 專欄: 加州 | 字體: 小 中 大
“我們不做任何傳統的運動控制,全部都是用強化學習。”他解釋,傳統方法在面對動態變化的環境,比如突然壹陣妖風,或者地面壹塊意想不到的凸起時,往往顯得捉襟見肘,穩定性不足。而強化學習,則被他們寄予了實現更強泛化能力的厚望。
這種方法的理念聽起來頗有幾分“大道至簡”的意味,執行起來卻艱深無比。想象壹下教壹個嬰兒走路,你不會為他編寫每壹塊肌肉如何收縮的指令,而是設定目標:別摔倒、往前走、左右腿交替。K-scale Lab團隊做的,正是類似的事情——為機器人定義壹套“獎勵函數”(Reward Function)。“比如說,我們設定機器人不能倒、雙腿必須交替前進、不能原地蹦跳,並且要保持壹定的速度往前走。”機器人便在壹次次模擬環境中的跌倒與爬起中,摸索著如何最大化這些“獎勵”,最終“學會”行走。
對強化學習的選擇,也深刻影響了他們的硬件選型。
“我覺得液壓系統壹定不會是未來的方向,因為它沒辦法很好地支持強化學習。”徐睿的這番話,無疑是對波士頓動力這類以液壓驅動聞名的行業前輩提出了含蓄的挑戰。
在他看來,電動馬達,尤其是那些受益於電動汽車技術進步的關節馬達,才是當下更優的選擇。
“這壹波人形機器人為什麼能重新火起來?不就是因為有了強化學習嘛!”他反問道,點出了技術迭代的核心驅動力。
正如許多人所判斷的那樣,機器人創業的興起,來源於叁方面作用的共同促進:以Transformer架構為基礎的大語言模型(LLM)和多模態模型,向全世界展示了通用人工智能的驚人潛力,也為機器人賦予更強的決策能力提供了可能。其次是硬件產業鏈的成熟,得益於電動汽車產業鏈的飛速發展,高性能的伺服電機、傳感器和電池技術成本不斷下降,為制造更靈活、更高效的機器人奠定了基礎。最後,資本的躁動,在目睹了OpenAI等為代表的生成式人工智能的巨大成功後,資本的嗅覺正從純粹的通用AI算法,轉向能與物理世界深度交互的“硬核科技” 。
“極客”先鋒隊:讓人形機器人踏入尋常愛好者家
這樣壹款幾乎完全依賴“自主學習”的先進機器人,它的第壹批用戶會是誰?出人意料的是,並非人們通常想象的工廠流水線,也不是高端的科研機構,更不是普通的家庭消費者。K-scale Lab團隊傾力打造的首款大型人形機器人,擁有24個自由度,定價卻控制在極具吸引力的1萬美元以內,其目標用戶,是美國市場上那群充滿熱情的“Geek”(極客/愛好者)。
“我們就希望,這個東西首先是賣給真正的愛好者,讓他們買回家去玩,去折騰。”徐睿描繪著他的用戶畫像。他希望這些極客們拿到機器人後,能像對待壹台開放的電腦壹樣,自己編程、自己訓練,讓機器人學會整理房間、跳壹支搞怪的舞,甚至完成更多天馬行空的自定義功能。
這不僅僅是壹個巧妙的市場切入策略,更是團隊深思熟慮的數據積累計劃。徐睿坦言,強化學習目前最大的瓶頸在於“數據量不足”。
“現在RL的天花板就是數據,機器人的有效交互數據實在太少了。”不同於可以吞噬整個互聯網文本的語言大模型,機器人的學習更依賴於真實物理世界的互動數據。通過將機器人率先投放到最具創造力和動手熱情的愛好者手中,他們期望能催生出海量、多樣化的使用場景和數據,反哺模型的迭代。
除了這款“大塊頭”,壹款售價約1000美元的小型機器人也已在緊鑼密鼓地籌備中。其潛在客戶群體,是那些希望孩子通過參與前沿科技項目來提升大學申請競爭力的高中生家長。市場的熱情超乎想象,據徐睿透露,這款小型機器人已經收到了高達2萬份的購買意向注冊。
盡管初期聚焦愛好者,但徐睿的目光顯然更為長遠。他相信,隨著技術的成熟和數據的積累,產品的功能會逐漸泛化,滲透到更多實用場景,比如實現簡單的聽寫、打掃等。同時,他們也關注著行業和學校市場,認為現有教育機器人在軟件開放性和技術支持方面,仍有巨大的提升空間。
軟硬壹體的堅持與開源社區的靈魂:ksim的誕生
“像我們這樣,既做硬件又做軟件,而且是深度結合的公司,在美國其實不多,很多是只做軟件或者AI訓練。”徐睿點出了團隊的核心競爭力之壹。他們堅信,硬件的物理性能與軟件的智能算法必須深度耦合,才能發揮出人形機器人的最大潛力。在硬件開發上,他們有叁個核心評價標准:可用性(能流暢實現基本動作)、健壯性(皮實耐用,不易損壞)和成本效益(價格親民)。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見