科普作家河森堡在微博中分享了他使用ChatGPT的經(jīng)歷。他在讓ChatGPT介紹文物“青銅利簋”時(shí),,發(fā)現(xiàn)其將西周文物的來歷編造成商王帝乙祭祀父親帝丁所鑄,,并且標(biāo)明了錯(cuò)誤的文獻(xiàn)來源,。在豆瓣,,陀思妥耶夫斯基的書迷也發(fā)現(xiàn)AI在使用聯(lián)網(wǎng)搜索功能時(shí)不懂裝懂、捏造細(xì)節(jié),。
法學(xué)碩士生小昭在寫論文時(shí)發(fā)現(xiàn),,AI生成的內(nèi)容有很多是錯(cuò)誤的。特別是在處理“深度偽造”的法律問題時(shí),,AI會(huì)生成虛假的法律條例和案例,。她還發(fā)現(xiàn),AI喜歡引用過于具體的數(shù)據(jù),,這些數(shù)據(jù)明顯是編造的,。盡管如此,小昭仍然依賴DeepSeek,、豆包,、Kimi等AI工具來輔助寫作,但她每次看到DeepSeek引用的內(nèi)容都要重新檢索確認(rèn)真實(shí)性,。
小昭的感受并不虛妄,。在Github上的一個(gè)名為Vectara的大模型幻覺測(cè)試排行榜中,2025年1月發(fā)布的DeepSeek R1,,幻覺率高達(dá)14.3%,,遠(yuǎn)高于其他國(guó)際先進(jìn)大模型。張俊林解釋,,DeepSeek生成的內(nèi)容比一般AI應(yīng)用更長(zhǎng),,更容易出錯(cuò)。此外,,DeepSeek在生成答案時(shí)展現(xiàn)出很強(qiáng)的創(chuàng)造性,,這與強(qiáng)調(diào)信息精確的要求相悖。