具身智能廠商正試圖加速走進大眾。
2025年世界人工智能大會(WAIC)上,各類型機器人的“巡展”和快閃活動,無疑成為最吸引觀眾駐足的亮點。跳街舞或打拳擊、裝爆米花或可樂、模擬工廠分揀或流水線工作等展示背后,顯示出廠商無一不在展開對具體場景落地的努力和思考。
當然也有現(xiàn)場觀眾發(fā)出疑問:這么慢的運行速度,是否真的能夠在商業(yè)化場景運作?會跳舞的機器人,到底能滿足什么場景需求?
中移智庫認為,與上屆大會相比,具身智能在技術方面從單模型向多模態(tài)躍遷,產(chǎn)品泛化能力和垂直應用均有提升,標準穩(wěn)步建立,生態(tài)不斷優(yōu)化。但此次大會也暴露出具身智能仍面臨數(shù)據(jù)基礎不佳、產(chǎn)業(yè)卡點淤塞、標準不健全的問題。
21世紀經(jīng)濟報道記者在現(xiàn)場采訪發(fā)現(xiàn),對關鍵零部件的自研能力正成為廠商競相強調(diào)的方向,但如何在其中進行從研發(fā)思路到商業(yè)化落地的能力再平衡,也是當下要回答的重要議題。
關鍵自研
從機器人研發(fā)角度看,多名從業(yè)者都對21世紀經(jīng)濟報道記者表示,旗下產(chǎn)品的目標是更高的自研比例。
一方面,更高的自主化程度可以加速公司內(nèi)部產(chǎn)品迭代速度;另一方面,自主研發(fā)核心元部件達到一定量級,對未來降本量產(chǎn)也將帶來幫助。
交銀國際就認為,以特斯拉擎天柱機器人為例,其量產(chǎn)時間相比原規(guī)劃推遲了一年,主要就是受制于零部件供應鏈不成熟,本體造價過高。該機構(gòu)指出,按照特斯拉CEO馬斯克的規(guī)劃目標,其核心零部件價值量排序為:六維力傳感器—行星滾柱絲杠—諧波減速器—空心杯電機—編碼器—無框力矩電機。
從企業(yè)的實踐來看,深謀科技聯(lián)合創(chuàng)始人、CEO鄭如萍對21世紀經(jīng)濟報道記者指出,“我們認為,針對具身智能體,要進行關鍵部件打造,目標需要做到軟硬件全棧自研。如人形機器人的關節(jié)驅(qū)動電機對扭矩、響應速度、體積密度要求極高,自主研發(fā)核心部件能讓硬件設計與軟件需求無縫匹配,避免傳統(tǒng)‘硬件外購+軟件適配’模式中的性能損耗。”
總結(jié)來說,全棧自研團隊可直接打通‘硬件參數(shù)—軟件邏輯—場景需求’的反饋鏈路。例如,當場景部署中發(fā)現(xiàn)機器人步態(tài)不穩(wěn)時,機械工程師可調(diào)整關節(jié)結(jié)構(gòu),軟件工程師同步優(yōu)化平衡算法,芯片團隊甚至能修改底層驅(qū)動邏輯,無需等待外部供應商的適配,迭代效率提升顯著。
“人形機器人的核心競爭力體現(xiàn)在‘運動精度、響應速度、環(huán)境感知、成本控制’等方面,這些都依賴于軟硬件協(xié)同的底層技術,但這些技術難以通過外購部件簡單復制,從而形成獨特的競爭壁壘?!彼M一步分析。
據(jù)悉,在硬件層面,目前深謀科技自主研發(fā)了靈巧手、壓電式六維力傳感器、聲表面波傳感器,在研準直驅(qū)關節(jié)模組。
魔法原子銷售總監(jiān)田罡則對21世紀經(jīng)濟報道記者表示,關節(jié)模組價格占機器人整機的約40%~50%,因此公司在本月初發(fā)布的雙足人形機器人MagicBot Z1中,搭載了自研高性能關節(jié)模組,有24個基礎自由度,最多可擴展至50個自由度;關節(jié)最大扭矩超過130N·m。此外,自研了行星減速執(zhí)行器、諧波減速執(zhí)行器以及直線執(zhí)行器,因此可以將核心零部件的自主率做到90%,下一步目標是做到100%自主率。
“關鍵模組自研后,可以在不同類型產(chǎn)品中快速復用。”他分析道,無論人形機器人形態(tài)還是機器狗形態(tài),其中的關鍵模組都能穿插復用;此外,還能基于此快速拓展新品類。據(jù)透露,今年下半年,公司會將產(chǎn)品矩陣進一步擴充。
成本優(yōu)化
當然全棧自研的道路并不好走,其中最關鍵的還是核心芯片。鄭如萍向記者分析,目前人形機器人“大腦”所用芯片通常有NVIDIA Jetson系列、地平線征程系列等,不同芯片在性能上存在算力不足、功耗較高等局限,但隨著商用加速,一旦任務量增大,算力、功耗、成本三者很容易失衡。
而當前特斯拉Dojo芯片集成了CPU、GPU、NPU,在AI推理、視覺處理和運動控制方面有優(yōu)化,人形機器人的“大腦”芯片未來將朝著提升AI推理效率、強化邊緣計算能力、模擬人腦架構(gòu)等方向發(fā)展,以滿足機器人在復雜環(huán)境中更智能、更高效運行的需求。這也是業(yè)界需要努力的方向之一。
在軟件層面,她認為更重要的是構(gòu)建一個世界模型?!皞€人認為,依賴海量數(shù)據(jù)的強化學習、大模型等技術,本質(zhì)上是通過統(tǒng)計規(guī)律和模式匹配完成任務,而非真正實現(xiàn)了類似人類的‘理解’能力,并不能真正和人類大腦相匹敵。”她指出,數(shù)據(jù)驅(qū)動的機器人無法理解目標背后的深層意圖,這并非否定強化學習、大模型的價值,而是未來還是需要具備因果邏輯和物理關系的通用具身智能世界模型來實現(xiàn)。這也是業(yè)界需要努力的方向。
機器人應用落地過程中,成本是繞不過去的坎。鄭如萍指出,海外機器人廠商的成本一直居高不下,除了各方面配置較高之外,還有同樣的配件國外成本高于國內(nèi)的原因。
國內(nèi)廠商則換了一種打法:用國產(chǎn)器件、協(xié)同優(yōu)化算法和結(jié)構(gòu),能省一顆六維力傳感器就省,能用輪式底盤解決的就不用雙腿;關節(jié)電機、減速器、結(jié)構(gòu)件全部本地化生產(chǎn),把“夠用即可”寫進產(chǎn)品定義,先把商業(yè)價值跑通,再迭代性能?!爱斎?,挑戰(zhàn)在于,某些場景如果節(jié)省了六維力傳感器,難以形成完整的反饋控制閉環(huán)?!彼赋?。
對于深謀科技自研的關鍵部件,鄭如萍表示,目前市面上以電阻應變式六維力傳感器為主,其最早是針對工業(yè)場景拿取靜態(tài)物體用,但未來在場景應用中,與人類互動需要適配高頻互動場景,壓電式六維力傳感器能更好應對這一難題。
聲表面波傳感器天然適合用在機器人身上,因為它是無線無源的產(chǎn)品,且當前深謀研發(fā)的聲表面波傳感器集成了多物理量參數(shù),如溫度、濕度、陀螺儀等,部署在人形機器人上后機器人可以告訴主人,現(xiàn)在環(huán)境變化可以及時進行穿衣或調(diào)整空調(diào)設置,未來還可以將生物化學傳感器集成在機器人身上,無痛無創(chuàng)識別人體的病理特征。
探路商用
裝爆米花、分揀貨品、成為流水線的一環(huán)……在WAIC現(xiàn)場,不少機器人都在積極充當打工人角色,引發(fā)眾多圍觀。
但也有觀眾提出質(zhì)疑:這速度也太慢了,人類分分鐘可以完成一大堆工作,機器人還在慢悠悠找準方向。
對此,一名行業(yè)從業(yè)者對21世紀經(jīng)濟報道記者分析,這本質(zhì)上是算法和電機等方面的平衡問題?!霸谒惴ǚ矫妫恍S商可能擔心如果速度過快,可能造成機器人穩(wěn)定性和安全交付性表現(xiàn)欠佳;電機方面,損耗過多就會產(chǎn)生很高熱量。因此這都需要從軟硬件方面聯(lián)合調(diào)優(yōu)?!?/p>
不難發(fā)現(xiàn),目前已經(jīng)在“打工”的人形機器人,率先落地的場景就是工廠,這與工廠環(huán)境具備標準化程度高、規(guī)模較大的特點有關。備受關注的特斯拉將擎天柱派駐工廠“打工”,實際上也與汽車在多類型傳感器,甚至自動駕駛相關能力方面,與人形機器人存在共通性有關。
魔法原子就首次在展臺還原了其全尺寸通用人形機器人MagicBot Gen1在工業(yè)場景中的落地案例。
田罡對21世紀經(jīng)濟報道記者表示,魔法原子目前在這三個領域有大量訂單:工業(yè)、商業(yè)和教育。
在鄭如萍看來,人形機器人商業(yè)化將遵循先工業(yè)再家用的模式循序漸進,即便目前機器人在流水線上看起來行動效率還有待提高,但能24小時工作的特性可以與之有所抵消。
當然也未必所有工廠場景都適合人形機器人,反而輪式機器人成本較低、同樣可以滿足部分需求——整體看,實際上今年市場上對人形機器人的需求與去年并沒有本質(zhì)不同。
目前深謀科技主要落地場景為電力和康養(yǎng)?!绊n國養(yǎng)老市場是全球老齡化最快、政府補貼最友好的試驗田?!彼赋?,公司已經(jīng)在韓國與LG、樂天等集團合作,將人形機器人產(chǎn)品落地康養(yǎng)市場,驗證可靠性、積累真實場景數(shù)據(jù)。這也是旗下機器人出海過程中重點打造的典型市場。
“銀發(fā)經(jīng)濟會是人形機器人有潛力的應用市場,我們將從高中低三檔去構(gòu)建產(chǎn)品體系,通過統(tǒng)一的后臺進行數(shù)據(jù)積累和管理,進而逐步讓產(chǎn)品迭代升級?!编嵢缙祭m(xù)稱。
當然長期來說,她指出,C端市場依然會是未來潛力巨大但也最難突破的市場,因為從安全性、互動性等多方面都要做到體驗最優(yōu)。
鄭如萍預計,當硬件成熟度、世界模型泛化能力與法規(guī)倫理框架都就位時,人形機器人才會逐漸敲開普通家庭的大門。中短期來說,預計2027年市場上會有較高需求出現(xiàn),2028年人形機器人將逐漸進入家庭場景。