第一批DeepSeek開(kāi)發(fā)者已開(kāi)始逃離了,。你是否開(kāi)始習(xí)慣DeepSeek的無(wú)所不能,?寫(xiě)方案,,找它!做PPT,找它!就連身體不舒服,,也想問(wèn)問(wèn)它!但有時(shí)候,,這個(gè)越來(lái)越多人信賴(lài)的工具也會(huì)“一本正經(jīng)地胡說(shuō)八道”,。
人工智能并不是萬(wàn)能的。廣州一所著名大學(xué)的教授最近在朋友圈里抱怨DeepSeek查文獻(xiàn)太不靠譜,。這位教授想用DeepSeek查一本書(shū)的信息,,結(jié)果發(fā)現(xiàn)給出的信息全是錯(cuò)的,包括作者,、出版年份和出版社,。教授去找DeepSeek理論,對(duì)方承認(rèn)錯(cuò)誤并表示抱歉,。
知名媒體人詹國(guó)樞也遇到過(guò)類(lèi)似的情況。他讓DeepSeek寫(xiě)一篇《史記·詹國(guó)樞列傳》,,結(jié)果開(kāi)頭的基本信息就被張冠李戴了,。他又讓DeepSeek寫(xiě)關(guān)于某位記者的文章,內(nèi)容文采飛揚(yáng)但案例都是虛構(gòu)的,。當(dāng)要求評(píng)價(jià)路遙的名著《平凡的世界》時(shí),,DeepSeek竟然說(shuō)是詹國(guó)樞的代表作。
陜西自媒體“決明子”曾問(wèn)DeepSeek西安安定門(mén)道路規(guī)劃為何繞一圈,。DeepSeek提出了一個(gè)“唐皇城交通靜默區(qū)”的概念,,解釋得有理有據(jù),但事實(shí)上這份文件中并沒(méi)有這樣的說(shuō)法,。DeepSeek承認(rèn)錯(cuò)誤后,,又繼續(xù)編織答案。
這些現(xiàn)象被稱(chēng)為AI幻覺(jué),。去年8月,,Arthur AI公司發(fā)布了一份報(bào)告,,比較了幾家大語(yǔ)言模型出現(xiàn)幻覺(jué)的概率,結(jié)果顯示這些模型都會(huì)產(chǎn)生幻覺(jué),。DeepSeek-R1的幻覺(jué)率尤其高,,達(dá)到了14.3%。這不僅比之前的版本高很多,,也遠(yuǎn)超行業(yè)平均水平,。DeepSeek自己也承認(rèn)技術(shù)局限性,生成內(nèi)容的底層邏輯是基于概率的,,因此存在可信度問(wèn)題,。
DeepSeek-R1之所以更嚴(yán)重,是因?yàn)樗訌?qiáng)了“思維鏈”和創(chuàng)造力,。例如,,它不僅能寫(xiě)五絕、七律,,還能流暢表達(dá)詩(shī)的意境,。然而,這種創(chuàng)造性也會(huì)帶來(lái)副作用,。面對(duì)復(fù)雜問(wèn)題時(shí),它能超常發(fā)揮,,但面對(duì)簡(jiǎn)單任務(wù)時(shí),,可能會(huì)過(guò)度發(fā)揮。比如問(wèn)它隔壁老王有多高,,它會(huì)根據(jù)一般人的身高腦補(bǔ)一個(gè)答案,。