在上海市智元機(jī)器人數(shù)據(jù)采集中心的廚房場(chǎng)景中,,一名數(shù)據(jù)采集員手持操作手柄指揮著機(jī)器人用一只手從調(diào)料架上拿起雞精調(diào)料瓶,,另一只手輕輕打開調(diào)料瓶蓋子,小心翼翼地捏起瓶?jī)?nèi)的小勺,將雞精撒入鍋中,。之后,機(jī)器人將調(diào)料勺放回調(diào)料瓶,,蓋上蓋子,,再把調(diào)料瓶放回調(diào)料架。這樣,,一條接近真實(shí)使用場(chǎng)景下的數(shù)據(jù)采集才算完成,。
該數(shù)據(jù)采集中心每天可以產(chǎn)出數(shù)萬條機(jī)器人真機(jī)數(shù)據(jù)和仿真環(huán)境數(shù)據(jù),這些數(shù)據(jù)用于訓(xùn)練大模型,,讓人形機(jī)器人學(xué)習(xí)并掌握這些技能,。智元機(jī)器人的通用具身機(jī)器人已實(shí)現(xiàn)量產(chǎn),在其工廠內(nèi),,一排排機(jī)器人正在組裝,、下線,目前的年產(chǎn)能力達(dá)到數(shù)千臺(tái),。
人形機(jī)器人的話題近年來再度火熱,,從央視春晚的機(jī)器人表演到資本市場(chǎng)的追捧,人形機(jī)器人成為科技賽道上的“流量密碼”,。成立于2023年2月的智元機(jī)器人是上海市張江機(jī)器人谷的一家知名公司,,已完成多輪融資,公司估值超過70億元人民幣,。
高質(zhì)量的數(shù)據(jù)對(duì)發(fā)展人形機(jī)器人至關(guān)重要,。姚卯青指出,現(xiàn)有的大規(guī)模開源數(shù)據(jù)集質(zhì)量較差且部分丟失,,行業(yè)需要一個(gè)高質(zhì)量,、大規(guī)模的數(shù)據(jù)集。智元機(jī)器人數(shù)據(jù)采集中心占地4000平方米,,搭建了家居,、餐廳、工業(yè),、商超,、辦公五大類場(chǎng)景,包含超過兩百個(gè)細(xì)分場(chǎng)景的任務(wù),。數(shù)百名數(shù)據(jù)采集員通過頭戴VR眼鏡,、手持操作手柄指揮機(jī)器人進(jìn)行各種動(dòng)作。例如,,在家居場(chǎng)景中,,機(jī)器人可以整理物品、收拾碗筷,、打掃房間,;在奶茶店場(chǎng)景中,,機(jī)器人可以制作奶茶、送餐,、收拾桌子等,。
數(shù)據(jù)采集過程中,數(shù)據(jù)采集員會(huì)不斷調(diào)整杯子和茶壺的位置,,記錄不同場(chǎng)景下的數(shù)據(jù),。同樣,采集機(jī)器人掃地時(shí),,也會(huì)將垃圾擺放在不同位置,,通過操作手柄讓機(jī)器人手臂上的吸塵器吸取垃圾。姚卯青表示,,通過預(yù)訓(xùn)練和高質(zhì)量數(shù)據(jù)采集,,機(jī)器人能夠?qū)崿F(xiàn)較好的倒水效果。阮丞則認(rèn)為,,教會(huì)人形機(jī)器人學(xué)會(huì)每項(xiàng)動(dòng)作所需的數(shù)據(jù)量因任務(wù)和要求不同而異,,隨著對(duì)機(jī)器人要求的提高,可能需要更多的數(shù)據(jù),。