實(shí)測(cè)DeepSeek深度思考模式低成本高效挑戰(zhàn)OpenAI

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-27 23:02:39 百家號(hào)

當(dāng)硅谷仍在為GPU萬(wàn)卡集群投入巨額資金時(shí),，來(lái)自杭州的一群年輕人用557.6萬(wàn)美元證明,，AI大模型的競(jìng)爭(zhēng)并不只依賴(lài)規(guī)模,，更看重使用效率,。一款上架不到半個(gè)月的應(yīng)用程序DeepSeek在1月27日登頂蘋(píng)果應(yīng)用商店排行榜,，擊敗了ChatGPT,。

最近幾天,，AI領(lǐng)域最火的大語(yǔ)言模型不是ChatGPT或文心一言,，而是杭州AI公司深度求索推出的DeepSeek。從去年12月26日發(fā)布的DeepSeek-V3到1月20日的DeepSeek-R1,，這家公司以O(shè)penAI三十分之一的價(jià)格實(shí)現(xiàn)了與o1模型相當(dāng)甚至超越的成績(jī),，給美國(guó)AI行業(yè)帶來(lái)了不小的沖擊。

經(jīng)過(guò)同題問(wèn)答測(cè)試,，DeepSeek-R1通過(guò)步步推理生成了具有邏輯性的回答,，用戶(hù)可以看到其思考過(guò)程。IT從業(yè)者劉鴻博表示,，這種體驗(yàn)與第一次使用ChatGPT 3.5相似,，甚至更加震撼。他認(rèn)為DeepSeek對(duì)高語(yǔ)境內(nèi)容和中文網(wǎng)絡(luò)梗的理解能力更強(qiáng),，達(dá)到了脫口秀文本的水平,。

DeepSeek-R1發(fā)布后，不少美國(guó)AI從業(yè)者在社交平臺(tái)上表達(dá)了內(nèi)心的震撼,。面對(duì)成本僅為“零頭”但性能優(yōu)秀的大模型,，許多人發(fā)現(xiàn)傳統(tǒng)的高投入模式已無(wú)法阻止用戶(hù)的選擇。北京時(shí)間1月27日,，DeepSeek在美國(guó),、中國(guó)和英國(guó)的App Store免費(fèi)應(yīng)用下載榜上名列前茅。

根據(jù)官方公布的性能測(cè)試,，DeepSeek在數(shù)學(xué)測(cè)試,、編程等多個(gè)領(lǐng)域與o1模型表現(xiàn)旗鼓相當(dāng)，在某些測(cè)試中還超過(guò)了o1模型,。此外,，DeepSeek的訓(xùn)練成本更低，使用的算力也受到限制,。相比之下,，Meta旗下Llama3.1 405B模型的訓(xùn)練成本超過(guò)6000萬(wàn)美元,，而OpenAI的GPT-4o模型的訓(xùn)練成本為1億美元,。

DeepSeek的價(jià)格優(yōu)勢(shì)早在去年年中就已顯現(xiàn)，但由于當(dāng)時(shí)知名度不高,，降價(jià)聲勢(shì)很快被其他大廠蓋過(guò)?，F(xiàn)在，除了價(jià)格優(yōu)勢(shì)外,，DeepSeek還有比肩o1模型的性能,。一些業(yè)內(nèi)人士認(rèn)為，DeepSeek可能顛覆硅谷巨頭的高投入路徑,，對(duì)那些依賴(lài)銷(xiāo)售大量GPU的公司形成挑戰(zhàn),。

在實(shí)際應(yīng)用方面,，DeepSeek的表現(xiàn)同樣令人印象深刻。通過(guò)聯(lián)網(wǎng)搜索功能,，DeepSeek能夠整理出詳細(xì)的事件表,，并展示清晰的思考過(guò)程。日常使用中,，用戶(hù)發(fā)現(xiàn)該模型對(duì)中國(guó)古代文化如生辰八字,、奇門(mén)遁甲等非常熟悉，且展示了專(zhuān)業(yè)的思考過(guò)程,。

DeepSeek之所以能以較低的成本訓(xùn)練出高性能模型,，是因?yàn)樗饤壛藗鹘y(tǒng)的監(jiān)督微調(diào)，采用單純的強(qiáng)化學(xué)習(xí)訓(xùn)練,。這一方法不僅減少了計(jì)算資源的需求,，還觀察到了模型的“頓悟時(shí)刻”。在處理復(fù)雜問(wèn)題時(shí),，模型會(huì)重新評(píng)估初步方法并分配更多思考時(shí)間,，顯示出高級(jí)的問(wèn)題解決策略。

DeepSeek團(tuán)隊(duì)由清華大學(xué)和北京大學(xué)的應(yīng)屆生和實(shí)習(xí)生主導(dǎo),，平均年齡不足26歲,。這種自下而上的創(chuàng)新文化與OpenAI早期類(lèi)似。面壁智能首席科學(xué)家劉知遠(yuǎn)認(rèn)為,，DeepSeek的成功證明了通過(guò)有限資源的高效利用可以實(shí)現(xiàn)以少勝多,，縮小了中美在AI領(lǐng)域的差距。未來(lái)發(fā)展路徑尚不明確,，仍需百倍努力探出新路,。

(責(zé)任編輯：張佳鑫 0764)

關(guān)閉

實(shí)測(cè)DeepSeek深度思考模式 低成本高效挑戰(zhàn)OpenAI

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

實(shí)測(cè)DeepSeek深度思考模式低成本高效挑戰(zhàn)OpenAI