第一批DeepSeek開發(fā)者已開始逃離了。你是否開始習(xí)慣DeepSeek的無(wú)所不能?寫方案,找它,!做PPT,,找它,!就連身體不舒服,也想問(wèn)問(wèn)它,!但有時(shí)候,,這個(gè)越來(lái)越多人信賴的工具也會(huì)“一本正經(jīng)地胡說(shuō)八道”。
人工智能并不是萬(wàn)能的,。廣州一所著名大學(xué)的教授最近在朋友圈里抱怨DeepSeek查文獻(xiàn)太不靠譜,。這位教授想用DeepSeek查一本書的信息,結(jié)果發(fā)現(xiàn)給出的信息全是錯(cuò)的,,包括作者,、出版年份和出版社。教授去找DeepSeek理論,,對(duì)方承認(rèn)錯(cuò)誤并表示抱歉,。
知名媒體人詹國(guó)樞也遇到過(guò)類似的情況。他讓DeepSeek寫一篇《史記·詹國(guó)樞列傳》,,結(jié)果開頭的基本信息就被張冠李戴了,。他又讓DeepSeek寫關(guān)于某位記者的文章,內(nèi)容文采飛揚(yáng)但案例都是虛構(gòu)的,。當(dāng)要求評(píng)價(jià)路遙的名著《平凡的世界》時(shí),,DeepSeek竟然說(shuō)是詹國(guó)樞的代表作。
陜西自媒體“決明子”曾問(wèn)DeepSeek西安安定門道路規(guī)劃為何繞一圈,。DeepSeek提出了一個(gè)“唐皇城交通靜默區(qū)”的概念,,解釋得有理有據(jù),但事實(shí)上這份文件中并沒(méi)有這樣的說(shuō)法,。DeepSeek承認(rèn)錯(cuò)誤后,,又繼續(xù)編織答案。
這些現(xiàn)象被稱為AI幻覺,。去年8月,,Arthur AI公司發(fā)布了一份報(bào)告,比較了幾家大語(yǔ)言模型出現(xiàn)幻覺的概率,,結(jié)果顯示這些模型都會(huì)產(chǎn)生幻覺,。DeepSeek-R1的幻覺率尤其高,達(dá)到了14.3%,。這不僅比之前的版本高很多,,也遠(yuǎn)超行業(yè)平均水平。DeepSeek自己也承認(rèn)技術(shù)局限性,,生成內(nèi)容的底層邏輯是基于概率的,,因此存在可信度問(wèn)題。
DeepSeek-R1之所以更嚴(yán)重,是因?yàn)樗訌?qiáng)了“思維鏈”和創(chuàng)造力,。例如,,它不僅能寫五絕、七律,,還能流暢表達(dá)詩(shī)的意境,。然而,這種創(chuàng)造性也會(huì)帶來(lái)副作用,。面對(duì)復(fù)雜問(wèn)題時(shí),,它能超常發(fā)揮,但面對(duì)簡(jiǎn)單任務(wù)時(shí),,可能會(huì)過(guò)度發(fā)揮,。比如問(wèn)它隔壁老王有多高,它會(huì)根據(jù)一般人的身高腦補(bǔ)一個(gè)答案,。
正因?yàn)槿绱?,在AI時(shí)代我們需要增強(qiáng)辨別能力。今年過(guò)年時(shí),,一個(gè)自稱是DeepSeek創(chuàng)始人梁文鋒的知乎用戶寫了段感人回復(fù),,后來(lái)證實(shí)這是假的。這段話符合人們對(duì)梁文鋒的想象,,甚至被廣泛傳播,。世界經(jīng)濟(jì)論壇發(fā)布的報(bào)告顯示,虛假信息和錯(cuò)誤信息對(duì)社會(huì)凝聚力和治理構(gòu)成威脅,。Vectara的研究表明,,一些聊天機(jī)器人編造事實(shí)的幾率高達(dá)30%。
哈爾濱工業(yè)大學(xué)(深圳)的張民教授認(rèn)為現(xiàn)階段AI幻覺難以完全消除,。作為使用者,,我們可以通過(guò)其他搜索引擎對(duì)比查詢,或驗(yàn)證DeepSeek引用的消息源,。AI并不能讓人一勞永逸,,反而提出了更高的要求,包括如何提問(wèn),、對(duì)話和辨別信息。最終,,人與人的差距可能會(huì)變得更大,。