為加速推動具身智能產業的發展,日前,國家地方共建具身智能機器人創新中心與北京大學計算機學院,聯合推出我國首個通用的具身智能機器人訓練開源數據集。該數據集對多種形態的機器人本體進行數據采集,包含了兩百多個不同任務的多類場景。具身智能賦予了機器人思考和執行復雜任務的能力,那么這些訓練機器人的數據是怎么來的?
這里就是創新中心機器人數據采集場。工程師通過操作機械臂,可以在虛擬的世界里捕捉機器人完成動作數據。

總臺央視記者 張春玲:這邊機器人正在進行真機訓練,通過遠程的遙控設備,機器人可以進行動作學習和抓取;這邊的工程師通過穿著全身動捕服飾,可以教會機器人如何一比一模仿人類行為和習慣。

記者看到,創新中心還搭建出了商業零售、工廠、居家環境等多類型的機器人數據訓練場。滿足機器人日常學習和數據采集的真實環境需求。據統計,本次創新中心發布的數據集采用了包括單臂機器人、雙臂機器人、人形機器人等多種形態的機器人本體進行數據采集,包含了279項不同任務的多類場景,涵蓋了高達61種不同的物體,具備多本體、多技能、多應用的特點,是我國首個具備通用性且由模型驗證有效的具身智能數據集。

國地共建具身智能機器人創新中心項目人員 魏嘉星:創新中心持續采集長程復雜任務,目前已經積累數十萬條高質量數據,以真機數據為主,配以仿真遙操作數據。我們創新中心未來還將逐步開源數據集,涵蓋更多機器人本體和場景任務。

專家介紹,數據集采集是否符合標準、在訓練上是否“能用”“好用”,是否能更有效支持模型泛化,已經成為機器人變“聰明”的關鍵。同數據集共同發布的,還有我國首個具身智能數據集的評測標準,進一步明確具身智能數據要求及質量,為行業的標準化與數據集建設提供指引。