- +1
自變量:35天后機(jī)器人入駐真實(shí)家庭,復(fù)雜且隨機(jī)性數(shù)據(jù)“必須采集”
機(jī)器人正式進(jìn)入家庭提上日程。
4月21日,自變量機(jī)器人舉行發(fā)布會(huì),推出新一代機(jī)器人進(jìn)家庭計(jì)劃,宣布35天后,機(jī)器人將搭載新一代自研具身智能基礎(chǔ)模型WALL-B入駐真實(shí)家庭。
自變量創(chuàng)始人兼CEO王潛在發(fā)布會(huì)上表示,當(dāng)前機(jī)器人的核心瓶頸不在本體,而在智能。家庭環(huán)境中的每一秒都可能出現(xiàn)全新事件:貓何時(shí)跳上桌子、孩子把玩具扔在哪里、地毯的摩擦力與實(shí)驗(yàn)室地板完全不同?,F(xiàn)有技術(shù)無法處理這種隨機(jī)性和碎片化,機(jī)器人進(jìn)入家庭也被視為“這個(gè)時(shí)代最難的技術(shù)問題之一”。

自變量創(chuàng)始人兼CEO王潛在發(fā)布會(huì)上
解決數(shù)據(jù)損耗:世界模型并非外掛模塊
據(jù)自變量聯(lián)合創(chuàng)始人兼CTO王昊介紹,WALL-B定位為基于世界統(tǒng)一模型架構(gòu)(WUM,World Unified Model) 的具身智能基礎(chǔ)模型,設(shè)計(jì)思路類似于Apple Silicon的統(tǒng)一內(nèi)存架構(gòu),在蘋果M1芯片之前的Mac上,CPU、GPU、內(nèi)存各自獨(dú)立,數(shù)據(jù)搬運(yùn)產(chǎn)生的延遲和損耗成為性能瓶頸,蘋果通過統(tǒng)一內(nèi)存架構(gòu)讓所有處理單元共享同一塊內(nèi)存,性能由此大幅提升。
在機(jī)器人領(lǐng)域,VLA(視覺-語言-動(dòng)作模型)就類似于M1之前的筆記本電腦架構(gòu),視覺模塊、語言模塊、動(dòng)作模塊各自為政,數(shù)據(jù)在模塊之間搬來搬去,每搬一次就丟一次信息。WALL-B將視覺、語言、動(dòng)作、物理預(yù)測等所有能力,放在同一個(gè)網(wǎng)絡(luò)中從零開始聯(lián)合訓(xùn)練、融為一體,消除了模塊間的邊界和數(shù)據(jù)搬運(yùn)損耗。
王昊強(qiáng)調(diào),世界模型并非一個(gè)單獨(dú)的外掛模塊,而是一種對物理世界未來的預(yù)測能力?!耙鉀Q數(shù)據(jù)損耗問題,不能簡單累加模塊,而是要補(bǔ)上預(yù)測能力。”
“糖水”與“牛奶”:看似最難的路反而可能最簡單
“這個(gè)行業(yè)最大的秘密,不是算法,不是架構(gòu),不是硬件,數(shù)據(jù)才是?!蓖蹶粚碓从趯?shí)驗(yàn)室的干凈、穩(wěn)定、可預(yù)測的數(shù)據(jù)比作“糖水?dāng)?shù)據(jù)”,用此類數(shù)據(jù)訓(xùn)練的模型,就像在泳池里學(xué)了10年游泳的人,一旦被丟進(jìn)大海就會(huì)淹死。“它很甜,但除了甜并不會(huì)增加抵抗力,也不會(huì)提升體質(zhì)。喝多了有可能還會(huì)增加患糖尿病的風(fēng)險(xiǎn)”,訓(xùn)練出的模型幾乎不具備零樣本泛化能力。
與之相對,源自真實(shí)家庭、復(fù)雜不可控且充滿隨機(jī)性的數(shù)據(jù)則是具身智能的“牛奶數(shù)據(jù)”。盡管采集過程“很苦、很慢、很貴”,但王昊認(rèn)為,要想要做出真正具備零樣本泛化能力的基礎(chǔ)模型,這條看似最難的路反而可能是最簡單的。為此,自變量團(tuán)隊(duì)進(jìn)入了超過100個(gè)志愿者的家庭去訓(xùn)練模型。

自變量聯(lián)合創(chuàng)始人兼CTO王昊在介紹WALL-B
完整工程閉環(huán):機(jī)器人領(lǐng)域領(lǐng)先窗口或達(dá)三年以上
王潛在接受澎湃新聞等媒體采訪時(shí)表示,機(jī)器人進(jìn)家庭目前并非百分百只靠AI模型去做,有時(shí)候還是得有人去在安全性等方面兜底和接管,但除了地形限制、工具太過復(fù)雜等情況外,所有能夠在物理上實(shí)現(xiàn)的事情,其實(shí)機(jī)器人都能做,“只要進(jìn)入家庭,你就可以使喚它,不需要再考慮有什么是能做的,有什么是不能做的”。
王潛認(rèn)為,企業(yè)長久的競爭力在于建立一個(gè)真正統(tǒng)一的閉環(huán)體系。相較于算法架構(gòu),模型背后的數(shù)據(jù)定義、采集、改造、后處理以及訓(xùn)練測評調(diào)整等完整的工程體系,才是最難被復(fù)制的部分。他以大模型行業(yè)為例稱,OpenAI曾領(lǐng)先谷歌近兩年,而在機(jī)器人領(lǐng)域,這樣的領(lǐng)先時(shí)間窗口會(huì)更長,可能達(dá)到三年以上。
值得一提的是,在發(fā)布會(huì)上,王潛也正式宣布自變量于近日完成了B輪融資,由小米戰(zhàn)投領(lǐng)投。此前有報(bào)道稱,自變量完成了近20億元的B輪融資,也成為國內(nèi)公開披露的唯一一家被四家互聯(lián)網(wǎng)大廠(字節(jié)、美團(tuán)、阿里、小米)投資的具身智能企業(yè)。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




