獲取高質(zhì)量數(shù)據(jù)的方式主要有標注、采集和生成,。數(shù)據(jù)標注以人機協(xié)同為主,,未來有望出現(xiàn)自動化程度更高的平臺。數(shù)據(jù)采集主要通過人工,、設(shè)備或爬蟲等方式進行,,適用于多種領(lǐng)域。數(shù)據(jù)生成則處于早期階段,,其中世界模型受到廣泛關(guān)注,,旨在生成高質(zhì)量虛擬場景,用于數(shù)據(jù)處理和模型訓(xùn)練,。雖然世界模型不能完全替代數(shù)據(jù)采集,,但可以實現(xiàn)有效互補。
為解決人工智能產(chǎn)業(yè)中的數(shù)據(jù)痛點,,多地政府加速推動高質(zhì)量數(shù)據(jù)建設(shè),。國家數(shù)據(jù)局在北京召開高質(zhì)量數(shù)據(jù)集建設(shè)工作啟動會,武漢市發(fā)布促進人工智能產(chǎn)業(yè)發(fā)展政策措施,,深圳市加快構(gòu)建高價值垂類數(shù)據(jù)集和具身智能數(shù)據(jù)集,。這些舉措表明,中國科技創(chuàng)新變革是舉國推動的結(jié)果,,人才紅利疊加完備產(chǎn)業(yè)鏈形成堅實基礎(chǔ),,科研型企業(yè)家實現(xiàn)了范式創(chuàng)新。還有許多優(yōu)秀創(chuàng)業(yè)者和研發(fā)團隊在日夜兼程,,政府也在積極推動基礎(chǔ)設(shè)施建設(shè),,為創(chuàng)新提供土壤,。