從今年春晚到兩會(huì),機(jī)器人火了,伴隨機(jī)器人出圈的還有一個(gè)新詞:具身智能。
具身智能是人工智能、機(jī)器人學(xué)、認(rèn)知科學(xué)的交叉領(lǐng)域,主要研究如何使機(jī)器人具備類似人類的感知、規(guī)劃、決策和行為能力。其中,具身智能機(jī)器人強(qiáng)調(diào)智能體須具備物理身體,通過傳感器感知環(huán)境,結(jié)合算法進(jìn)行自主規(guī)劃與決策,最終通過執(zhí)行器完成物理交互任務(wù),實(shí)現(xiàn)“感知—行動(dòng)”的閉環(huán)。
目前,北京已擁有人工智能相關(guān)企業(yè)約2400家,2024年全年北京人工智能核心產(chǎn)業(yè)規(guī)模已突破3000億元。其中,具身智能領(lǐng)域數(shù)百家企業(yè)已在北京多個(gè)園區(qū)顯現(xiàn)出集群效應(yīng),在具身智能產(chǎn)業(yè)的人形化、人性化、應(yīng)用化等方面取得重要突破,形成了以“大腦、小腦、本體”為核心的具身智能全產(chǎn)業(yè)鏈條。
本體升級(jí) 解鎖具身智能機(jī)器人的多元本領(lǐng)
為了最大限度適配人類環(huán)境,達(dá)到資源利用率最大化。在北京,有不少企業(yè)選擇直接將具身智能機(jī)器人開發(fā)為“人形”形態(tài),這個(gè)靈活且堅(jiān)硬的外殼就稱為它的“本體”。那么,北京在具身智能機(jī)器人的本體方面發(fā)展如何?在技術(shù)方面實(shí)現(xiàn)了哪些關(guān)鍵突破?從室內(nèi)場(chǎng)景到室外環(huán)境,他們都掌握了哪些新技能?
這個(gè)奔跑著穿越戈壁、公路、草地的機(jī)器人叫作STAR1,它是北京星動(dòng)紀(jì)元公司推出的最新款人形機(jī)器人。它身高171cm,體重63kg,全身共有55個(gè)自由度,可在室外真實(shí)場(chǎng)景達(dá)到3.6m/s的奔跑速度,這也一舉打破了電驅(qū)人形機(jī)器人奔跑速度的世界紀(jì)錄。
北京星動(dòng)紀(jì)元科技有限公司聯(lián)合創(chuàng)始人 席悅:要跑得快,除了在關(guān)節(jié)轉(zhuǎn)矩,輸出轉(zhuǎn)矩比較高的情況下,還要保證輸出的轉(zhuǎn)速足夠高,這兩者加起來,其實(shí)是它關(guān)節(jié)的輸出功率要足夠高才能實(shí)現(xiàn)。想跑得穩(wěn),除了剛剛提到這兩點(diǎn)以外,還得確保結(jié)構(gòu)的穩(wěn)定性要足夠好,這個(gè)就包括結(jié)構(gòu)的剛性強(qiáng)度要足夠高。
而除了跑得快、跑得穩(wěn)以外,STAR1還具備抓得動(dòng)、抓得準(zhǔn)的技能,它所配備的靈巧手雖與人類手掌大小相當(dāng),但卻裝配了12個(gè)主動(dòng)、全直驅(qū)自由度,僅需動(dòng)用單手四指便可提動(dòng)20kg的重物。
而且,在經(jīng)過自研的端到端原生機(jī)器人大模型深度學(xué)習(xí)與訓(xùn)練后,STAR1還可自主完成用筷子夾水餃、用手捏骰子等精細(xì)化靈巧操作。此外,靈巧手上所配備的高分辨率觸覺陣列傳感器,可提供精確的三維力觸覺和溫度信息,使其在抓取玻璃杯等易碎物品時(shí)也能保持合適的力度,保障安全操作。
北京星動(dòng)紀(jì)元科技有限公司聯(lián)合創(chuàng)始人 席悅:最終就是想實(shí)現(xiàn)機(jī)器人走進(jìn)家庭,手足夠靈巧的話,它就可以更適應(yīng)家庭環(huán)境,很完美地融入人類居住的環(huán)境,也能使用人類的工具去做更多任務(wù)。
而另一邊,北京市朝陽區(qū)的一家企業(yè)也正在進(jìn)行具身智能人形機(jī)器人的研發(fā)工作,只不過,這位機(jī)器人與前面的大不相同,他們?cè)诖罱C(jī)器人本體的基礎(chǔ)上,還為機(jī)器人賦予了皮膚,并通過深度學(xué)習(xí)和訓(xùn)練,使這款仿生交互智能機(jī)器人可驅(qū)動(dòng)面部的仿生肌肉與皮膚,向人們表現(xiàn)出涵蓋6類基礎(chǔ)情緒的200多種動(dòng)態(tài)表情,并可做到漢語、英語、韓語等多種語言與口型的擬合表現(xiàn)。
北京清飛科技有限公司研發(fā)一部技術(shù)總監(jiān) 李孟偉:如果它能用情緒輸出,這樣天然跟人就比較親近。我們希望把這個(gè)延伸出來,第一作為接待,第二可能會(huì)在養(yǎng)老社區(qū)做一些落地。
“大小腦”協(xié)同 讓智能機(jī)器人服務(wù)更多場(chǎng)景
具身智能機(jī)器人的泛化能力,主要來自它的“大腦”和“小腦”,也就是具身大模型,需要聽懂指令,并帶動(dòng)本體具體實(shí)施行動(dòng)和行為。同時(shí),機(jī)器人會(huì)根據(jù)動(dòng)態(tài)變化的環(huán)境自動(dòng)調(diào)整工作方式,這是檢驗(yàn)機(jī)器人實(shí)用性的重要標(biāo)準(zhǔn)。
目前,適用于各行業(yè)的泛化機(jī)器人正從實(shí)驗(yàn)室走到生活中,相關(guān)部門和企業(yè)正在推動(dòng)它們逐步出現(xiàn)在工廠、便利店甚至是足球場(chǎng)上,并將在未來達(dá)到滿足人類真正生產(chǎn)生活所需所用,賦能千行百業(yè)。
02:34
在北京的一處研發(fā)中心,機(jī)器人正精準(zhǔn)地依據(jù)指令抓取貨架商品以完成售賣。它通過解析指令、掃描貨架,直接抓取產(chǎn)品。研究團(tuán)隊(duì)表示,機(jī)器人模型落地過程中,不同場(chǎng)景就會(huì)有不同的特殊需求。
北京銀河通用機(jī)器人有限公司市場(chǎng)部相關(guān)負(fù)責(zé)人 武文韜:我們將具身大模型的能力賦能到了機(jī)器人的身體里面,幫助它既可以理解人類指令,也可以在各種場(chǎng)景下完成各種各樣的任務(wù),具備通用機(jī)器人的能力。比如它可以在商超里面去執(zhí)行取貨,工廠里面去做料箱的搬運(yùn)、分揀;家庭里面還可以去疊衣服、清理垃圾、清理雜物,完成家務(wù)。
目前,具身大模型的泛化訓(xùn)練已經(jīng)做好了落地應(yīng)用的準(zhǔn)備,在無人值守的便利店和藥店的展示場(chǎng)景中,機(jī)器人可以抓取袋裝、瓶裝、易碎、異形的多種商品,從接收、取單再到完成商品抓取并送貨,只需40秒左右。