小心AI在胡說八道,!2025年2月,中國人民大學(xué)教授李婷公開辟謠了一組數(shù)據(jù)——“中國80后累計(jì)死亡率為5.20%”,。在社交媒體上,許多“80后”因這組數(shù)據(jù)感到惋惜,。自媒體聲稱:“截至2024年末,,80后的死亡率已經(jīng)超過70后,相當(dāng)于每20個(gè)80后中,,就有1人已經(jīng)去世,。”
李婷教授在接受采訪時(shí)表示,,這一說法明顯錯(cuò)誤,,因?yàn)閷I(yè)統(tǒng)計(jì)數(shù)據(jù)中的死亡率通常用千分率表示,而不是百分率,。她還指出,,國家統(tǒng)計(jì)局并未公布2024年的死亡率,也不會(huì)根據(jù)“80后”,、“90后”等分段公布死亡人數(shù),,因此這一說法毫無數(shù)據(jù)支撐。
關(guān)于虛假數(shù)據(jù)的來源,,李婷認(rèn)為可能源于AI大模型出錯(cuò),。她在AI大模型中輸入問題:“50后、60后,、70后,、80后,這幾代人的死亡率分別是多少”,大模型回答:“80后現(xiàn)存2.12億,,存活率94.8%,,死亡率5.2%?!边@種無中生有的能力被稱為“幻覺”,,即AI在遇到不熟悉的問題時(shí)編造難以辨明真假的細(xì)節(jié)。
新浪新技術(shù)研發(fā)負(fù)責(zé)人張俊林提到,,隨著各個(gè)領(lǐng)域加強(qiáng)對(duì)AI的接入,,AI幻覺成為需要重視的問題,但目前尚未找到根除辦法,。清華大學(xué)長聘副教授陳天昊也表示,,對(duì)于學(xué)生等特殊人群來說,大模型幻覺問題帶來的風(fēng)險(xiǎn)更大,。例如,,小學(xué)生可能和家長一起使用大模型學(xué)習(xí)知識(shí),但大模型產(chǎn)生的幻覺可能會(huì)產(chǎn)生誤導(dǎo),。
科普作家河森堡在微博中分享了他使用ChatGPT的經(jīng)歷,。他在讓ChatGPT介紹文物“青銅利簋”時(shí),發(fā)現(xiàn)其將西周文物的來歷編造成商王帝乙祭祀父親帝丁所鑄,,并且標(biāo)明了錯(cuò)誤的文獻(xiàn)來源,。在豆瓣,陀思妥耶夫斯基的書迷也發(fā)現(xiàn)AI在使用聯(lián)網(wǎng)搜索功能時(shí)不懂裝懂,、捏造細(xì)節(jié),。
法學(xué)碩士生小昭在寫論文時(shí)發(fā)現(xiàn),AI生成的內(nèi)容有很多是錯(cuò)誤的,。特別是在處理“深度偽造”的法律問題時(shí),,AI會(huì)生成虛假的法律條例和案例。她還發(fā)現(xiàn),,AI喜歡引用過于具體的數(shù)據(jù),,這些數(shù)據(jù)明顯是編造的。盡管如此,,小昭仍然依賴DeepSeek,、豆包、Kimi等AI工具來輔助寫作,,但她每次看到DeepSeek引用的內(nèi)容都要重新檢索確認(rèn)真實(shí)性,。
小昭的感受并不虛妄。在Github上的一個(gè)名為Vectara的大模型幻覺測試排行榜中,,2025年1月發(fā)布的DeepSeek R1,,幻覺率高達(dá)14.3%,,遠(yuǎn)高于其他國際先進(jìn)大模型。張俊林解釋,,DeepSeek生成的內(nèi)容比一般AI應(yīng)用更長,,更容易出錯(cuò)。此外,,DeepSeek在生成答案時(shí)展現(xiàn)出很強(qiáng)的創(chuàng)造性,,這與強(qiáng)調(diào)信息精確的要求相悖。
清華大學(xué)團(tuán)隊(duì)在2025年2月發(fā)布《DeepSeek與AI幻覺》報(bào)告,,將AI幻覺分為兩類:事實(shí)性幻覺和邏輯性幻覺,。香港科技大學(xué)團(tuán)隊(duì)的研究指出,,導(dǎo)致AI幻覺的原因包括數(shù)據(jù)源問題,、編碼器設(shè)計(jì)問題、解碼器錯(cuò)誤解碼等,。從AI大模型原理的角度看,,AI幻覺被業(yè)界認(rèn)為是AI擁有智能的體現(xiàn)。出門問問大模型團(tuán)隊(duì)前工程副總裁李維解釋,,幻覺的本質(zhì)是補(bǔ)白,,是腦補(bǔ)。
AI自己也承認(rèn)幻覺的存在,。在深度思索模式下,,DeepSeek列出了自己的反思,表示知識(shí)邊界限制和生成機(jī)制特性導(dǎo)致了這一結(jié)果,。盡管AI的幻覺在某些科研工作中有用,,如新分子的發(fā)現(xiàn),但解決或改善幻覺問題仍非常重要,。美國知名律師事務(wù)所Morgan & Morgan警告律師不要在法庭文件中使用AI生成的虛假信息,,否則可能面臨嚴(yán)重后果??萍脊疽苍趪L試通過檢索增強(qiáng)生成技術(shù)(RAG)等方式減少幻覺的產(chǎn)生,,但目前還沒有根除方法。
OpenAI華人科學(xué)家翁荔建議,,確保模型輸出是事實(shí)性的并可以通過外部世界知識(shí)進(jìn)行驗(yàn)證,。谷歌的Gemini模型提供了“雙重核查響應(yīng)”功能,以幫助用戶辨別內(nèi)容的真實(shí)性,。這些努力都在提醒人們不要全然相信AI,。