今年2月,人形機器人做前空翻的視頻上了熱搜,一臺人形機器人以矯健身姿完成了一個干凈利落的前空翻,落地時甚至比許多人類運動員還要穩。
這兩天,人形機器人的技能又提升了。北京一家機器人研發團隊,對外展示了可以連續后空翻的人形機器人。
總臺央視記者 張春玲:機器人又迭代了!我身旁個子比較矮小,只有1米3的人形機器人,它剛剛實現了多個連續后空翻的高難度動作,它的名字叫N2。
團隊技術負責人 姜哲源:后空翻相比前空翻難的地方在于人一般后腳掌比前腳掌要短,后空翻的時候順著慣性更容易往后倒,后腳掌短的話更容易掀過去,前空翻的話前腳更長,更不容易被掀過去。因此后空翻相比起來難度會稍微更大一點。
為了實現機器人后空翻的穩定性,團隊在硬件結構上進行了創新設計。他們盡可能將重量較大的關節向胯部集中,從而讓機器人在翻轉過程中使的力氣最小。同時,他們采用了功率更為強勁的電機以及更為輕的材料,讓機器人具有更大的爆發力。
三個禮拜學會后空翻
機器人如何做到?
雖然后空翻的動作難度大,但是記者在采訪中了解到,機器人團隊僅用了三周,就讓機器人學會了這個特殊技能。
問題來了
讓機器人學會后空翻
如何做到?
需要幾步?
1.首先,團隊在數字世界中,通過一系列動力學計算優化,得到一個翻跟頭的最優軌跡。
2.隨后,他們在虛擬仿真中,通過強化學習的方法,讓成百上千的機器人模仿這個翻跟頭的最優軌跡,不斷試錯。
3.由于后空翻是一個相對較難的動作,團隊還在訓練中加入了一種課程學習的方法,讓機器人像人去上課一樣,從易到難,一點點完成精準的軌跡復刻。
4.隨后,再將訓練好的算法遷移到機器人本體上,通過不斷的反復測試,在仿真世界和機器人真機里不斷進行系統優化,讓真實的機器人也能具備復刻后空翻的能力。
團隊算法工程師 李勝濤:我們通過給它一些關節角度的跟蹤獎勵,如果它跳得高了或者矮了,我們會給他一些懲罰,通過這樣一套方法,然后讓它不斷去貼合專家數據。
專家介紹,不論是爬臺階、還是后空翻,甚至做出一些更加高難度的動作,最近機器人的動作技能變強的“武林秘籍”,離不開一個叫做“強化學習”的人工智能學習范式。它可以讓機器人在未知的數字世界里,通過給機器人一個標準,讓它像人類一樣“試錯成長。”讓機器人通過“試錯”和“懲罰”自主進化。