生成式模型的訓練依賴于大量公開的網(wǎng)絡(luò)數(shù)據(jù),,而互聯(lián)網(wǎng)上的信息質(zhì)量良莠不齊,,網(wǎng)友們的觀點通常帶有強烈的個人色彩,。即使盡力清洗和過濾訓練數(shù)據(jù),,也很難完全避免有害內(nèi)容的滲透。如果訓練數(shù)據(jù)中含有偏見或錯誤信息,,模型不僅會繼承這些信息,,還可能通過生成新內(nèi)容的方式進一步放大這些問題。由于生成式人工智能模型可以高效地生成海量內(nèi)容,,錯誤觀點和有害信息通過AIGC得以更廣泛、更快速地傳播,,并且由于其逼真的表現(xiàn)形式,,極易影響公眾判斷,污染網(wǎng)絡(luò)數(shù)據(jù)導向,。
生成式人工智能可以根據(jù)人的指令生成不存在的內(nèi)容,,極易被用于自動生成虛假新聞和謠言。深度偽造技術(shù)正快速發(fā)展,,圖片偽造,、音頻合成和視頻換臉在生成式AI的幫助下變得輕而易舉,這些虛假內(nèi)容能夠以逼真的形式迅速傳播,,帶來嚴重的社會影響,。
從全社會層面來看,倘若低質(zhì)量的生成內(nèi)容涌入公共數(shù)據(jù)源,,將進一步污染全社會的數(shù)據(jù)來源,。當數(shù)據(jù)源被大量低質(zhì)量生成內(nèi)容占據(jù),數(shù)據(jù)生態(tài)將逐步崩潰,,構(gòu)建優(yōu)質(zhì)數(shù)據(jù)要素將無從談起,。這不僅影響人工智能行業(yè)的發(fā)展,還會波及各個依賴數(shù)據(jù)要素進行生產(chǎn)活動的行業(yè)和領(lǐng)域,例如新聞,、教育,、公共安全等。
AIGC數(shù)據(jù)需要“清污”?,F(xiàn)存的隱私保護,、知識產(chǎn)權(quán)和數(shù)據(jù)信息相關(guān)的法律與大數(shù)據(jù)時代已經(jīng)不匹配。面對互聯(lián)網(wǎng)上新增的海量原始數(shù)據(jù),,我們亟須構(gòu)建完善的數(shù)據(jù)內(nèi)容維護,、數(shù)據(jù)質(zhì)量管理和數(shù)據(jù)安全監(jiān)管體系。
聯(lián)合國大學關(guān)于AIGC數(shù)據(jù)利用與風險的一份調(diào)研報告建議:全面推進AIGC相關(guān)立法,,從源頭防范數(shù)據(jù)污染問題,;構(gòu)建全面的AIGC數(shù)據(jù)質(zhì)量與安全評價體系,促進合成數(shù)據(jù)的合理利用,;將AIGC數(shù)據(jù)管理納入全球AI治理合作,,促成全球范圍內(nèi)全面解決合成數(shù)據(jù)帶來的風險;加快明確生成式人工智能倫理與隱私準則,,增強生成式人工智能技術(shù)的透明性,,防范有違全人類共同價值的AIGC內(nèi)容擴散,并解決用戶隱私和數(shù)據(jù)濫用等問題,。
生態(tài)安全對于文明的繁榮至關(guān)重要,,它構(gòu)成了國家安全的基本組成元素,并保障著經(jīng)濟社會的持續(xù)健康發(fā)展
2024-05-13 11:02:31這些生態(tài)數(shù)據(jù)關(guān)乎國家安全切勿泄密