近日,繼10月9日宣布與全球智能產(chǎn)品ODM頭部企業(yè)龍旗科技達(dá)成深度戰(zhàn)略合作后,智元機(jī)器人再次公布一項(xiàng)重大技術(shù)突破:其研發(fā)的真機(jī)強(qiáng)化學(xué)習(xí)技術(shù),已在與龍旗科技合作的驗(yàn)證產(chǎn)線中成功落地,為消費(fèi)電子等精密制造領(lǐng)域帶來(lái)“即插即用”的智能升級(jí)方案。
據(jù)了解,智元此次落地的真機(jī)強(qiáng)化學(xué)習(xí)方案,實(shí)現(xiàn)的突破主要在于:機(jī)器人可在真實(shí)產(chǎn)線中自主學(xué)習(xí)、持續(xù)優(yōu)化作業(yè)策略,新技能訓(xùn)練與穩(wěn)定部署僅需數(shù)十分鐘,且性能全程不降級(jí)。在換線、換型或流線調(diào)整時(shí),該系統(tǒng)只需最小的硬件改動(dòng)和標(biāo)準(zhǔn)化部署流程,即可顯著提升柔性、壓縮部署時(shí)間與成本,破解“產(chǎn)線剛性與產(chǎn)能波動(dòng)”的行業(yè)痛點(diǎn)。
長(zhǎng)期以來(lái),精密制造產(chǎn)線面臨剛性瓶頸,傳統(tǒng)機(jī)械臂依賴復(fù)雜夾具設(shè)計(jì)與場(chǎng)地改造,調(diào)試周期長(zhǎng)、換型成本高;“視覺(jué)+力控”等柔性方案雖有改進(jìn),卻存在參數(shù)敏感、部署復(fù)雜等問(wèn)題,難以適配消費(fèi)電子行業(yè)高頻產(chǎn)品迭代需求。
相較傳統(tǒng)方案,該真機(jī)強(qiáng)化學(xué)習(xí)方案具備三大核心優(yōu)勢(shì)。一是極速部署,訓(xùn)練周期從“數(shù)周”銳減至“數(shù)十分鐘”,效率實(shí)現(xiàn)指數(shù)級(jí)提升;二是超高適配,自主克服來(lái)料位置偏差、尺寸公差等擾動(dòng),在長(zhǎng)周期運(yùn)行中持續(xù)保持工業(yè)級(jí)穩(wěn)定性與100%任務(wù)完成率;三是柔性換型,任務(wù)變更僅需快速再訓(xùn)練,無(wú)需定制夾具或復(fù)雜工裝,即可適配不同產(chǎn)品與工序,破解消費(fèi)電子行業(yè)長(zhǎng)期存在的“產(chǎn)線剛性與產(chǎn)能波動(dòng)”難題。
智元機(jī)器人表示,真機(jī)強(qiáng)化學(xué)習(xí)方案在占用空間、硬件依賴與環(huán)境適配方面展現(xiàn)出高度通用性,可在不同工位和產(chǎn)品線上快速遷移與復(fù)用。
機(jī)器人在十分鐘內(nèi)學(xué)會(huì)新技能,這一進(jìn)步背后的技術(shù)突破如何?11月3日,智元機(jī)器人合伙人兼首席科學(xué)家羅劍嵐在接受證券時(shí)報(bào)等媒體采訪時(shí)表示,機(jī)器人實(shí)現(xiàn)十分鐘學(xué)會(huì)新技能,主要是通過(guò)預(yù)訓(xùn)練模型,結(jié)合少量示范和糾錯(cuò),快速點(diǎn)亮策略,并在工業(yè)給定范圍內(nèi)微調(diào)參數(shù)來(lái)達(dá)成的。
“在工業(yè)產(chǎn)線上,能把技術(shù)做到50%和做到100%,是完全不同的兩件事,智元目前是首個(gè)真正將真機(jī)強(qiáng)化學(xué)習(xí)應(yīng)用在產(chǎn)線上的廠商,這一突破點(diǎn)主要在于性能,在于真正能將AI模型部署在工廠中,實(shí)現(xiàn)百分之百的準(zhǔn)確率?!绷_劍嵐指出。
據(jù)羅劍嵐介紹,與傳統(tǒng)的仿真強(qiáng)化學(xué)習(xí)相比,真機(jī)強(qiáng)化學(xué)習(xí)的核心突破在于直接將學(xué)習(xí)閉環(huán)嵌入產(chǎn)線?!安恍枰庖粋€(gè)近似目標(biāo),而是直接優(yōu)化最關(guān)心的指標(biāo),把通過(guò)率、節(jié)拍、良率這些變成訓(xùn)練時(shí)的第一性目標(biāo),而不是像傳統(tǒng)方法那樣去解一個(gè)近似目標(biāo)。真機(jī)強(qiáng)化學(xué)習(xí)使用的是產(chǎn)線原生信號(hào)進(jìn)行判定和獎(jiǎng)勵(lì),這樣就無(wú)需解決仿真與現(xiàn)實(shí)的差距問(wèn)題,傳統(tǒng)強(qiáng)化學(xué)習(xí)大多在仿真環(huán)境中進(jìn)行,而我們直接在真實(shí)產(chǎn)線中解決這個(gè)問(wèn)題。”
從落地場(chǎng)景來(lái)看,智元真機(jī)強(qiáng)化學(xué)習(xí)方案在龍旗科技產(chǎn)線中落地,主要用于上下料這類傳統(tǒng)自動(dòng)化難以完成、需要柔性換線的任務(wù)。上下料指的是在工廠中將料品在不同工序間轉(zhuǎn)移、放置的過(guò)程,羅劍嵐指出,目前整個(gè)工業(yè)中未被自動(dòng)化或難以自動(dòng)化的環(huán)節(jié),約80%都集中在上下料,這類任務(wù)的主要難點(diǎn)在于工序間的不確定性、有限范圍內(nèi)的變化,以及對(duì)精度的要求。
“龍旗內(nèi)部有很多工序,我們之所以選擇上下料這個(gè)工序作為起點(diǎn),是因?yàn)樗哂写硇裕S多工序抽象出來(lái)都有共性。比如我們?cè)邶埰炜萍糉CT測(cè)試站上看到的iPad放置工序,就是一個(gè)要求非常精密、輕柔、穩(wěn)妥,不能有任何損壞的高精度工序?!绷_劍嵐進(jìn)一步解釋稱。
羅劍嵐強(qiáng)調(diào),真機(jī)強(qiáng)化學(xué)習(xí)方案在產(chǎn)線工序上落地,相當(dāng)于在工序上不斷鍛煉機(jī)器和大腦。每個(gè)工序、產(chǎn)線或機(jī)臺(tái)都存在微小差異,比如料盤放置等都有隨機(jī)性,但其也有共性,智元的做法是最大限度地將共性部分提取和共享,對(duì)差異化部分則通過(guò)真機(jī)強(qiáng)化學(xué)習(xí)進(jìn)行優(yōu)化,最終達(dá)到工廠要求的百分百成功率、接近人的節(jié)拍數(shù),以及極致的魯棒性(指系統(tǒng)在面對(duì)不確定性、變化和干擾時(shí),能夠維持其性能和穩(wěn)定性的能力)。
此次智元機(jī)器人真機(jī)強(qiáng)化學(xué)習(xí)落地工業(yè)產(chǎn)線,或?yàn)榫呱碇悄芄I(yè)化開啟新紀(jì)元。智元機(jī)器人表示,智元與龍旗科技雙方將基于本次成果持續(xù)推進(jìn)技術(shù)迭代,推動(dòng)真機(jī)強(qiáng)化學(xué)習(xí)在消費(fèi)電子、汽車電子等更多精密制造場(chǎng)景的應(yīng)用與復(fù)制,加速構(gòu)建具身智能驅(qū)動(dòng)的 AI 制造生態(tài),助力工業(yè)智能化的普及化與標(biāo)準(zhǔn)化進(jìn)程。