DeepSeek出圈背后的邏輯開源與高效性的勝利

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-02-06 09:59:00 澎湃新聞

AI若要真正賦能全人類，讓每個人都能用得上,、用得起大模型和通用人工智能,，高效性是關(guān)鍵。智能革命需要像信息革命一樣,，不斷提高能力密度,，降低計(jì)算成本，使大模型更加普惠,。

清華大學(xué)長聘副教授劉知遠(yuǎn)在一場由中國計(jì)算機(jī)學(xué)會青年計(jì)算機(jī)科技論壇策劃的直播活動中表示,，DeepSeek R1的開源標(biāo)志著人工智能領(lǐng)域再次迎來了類似2023年初ChatGPT的時刻，展示了強(qiáng)大的深度思考能力,。這場直播的主題為“夜話DeepSeek: 技術(shù)原理與未來方向”,，參與討論的還有復(fù)旦大學(xué)教授邱錫鵬和清華大學(xué)教授翟季冬等。

劉知遠(yuǎn)認(rèn)為,，DeepSeek V3展示了如何以十分之一甚至更少的成本達(dá)到GPT-4和GPT-4o水平的能力,。DeepSeek R1的成功在于它通過純粹的強(qiáng)化學(xué)習(xí)技術(shù)復(fù)現(xiàn)了OpenAI o1的深度推理能力，并且開源并發(fā)布了詳細(xì)的技術(shù)介紹,。這不僅證明了OpenAI不開源,、不公開技術(shù)細(xì)節(jié)且定價過高的策略存在缺陷，還為行業(yè)做出了重要貢獻(xiàn),。

DeepSeek R1的訓(xùn)練流程有兩個亮點(diǎn)：一是基于規(guī)則的方法實(shí)現(xiàn)了大規(guī)模強(qiáng)化學(xué)習(xí),，二是將強(qiáng)化學(xué)習(xí)技術(shù)泛化到多個領(lǐng)域，使其在實(shí)際應(yīng)用中表現(xiàn)出色,。這種泛化能力通過兩個階段實(shí)現(xiàn)：首先生成帶有深度推理能力的數(shù)據(jù),，然后通過強(qiáng)化學(xué)習(xí)進(jìn)一步訓(xùn)練，最終得到具有強(qiáng)大泛化能力的強(qiáng)推理模型,。

DeepSeek R1的成功還在于其開源性質(zhì),，使得全球用戶能夠使用并感受到深度思考的能力,。相比之下，OpenAI選擇不開源且收費(fèi)高昂,，限制了其普及程度,。因此，DeepSeek R1在全球范圍內(nèi)引起了廣泛關(guān)注,。

此外,，DeepSeek V3和R1的發(fā)展也啟示我們，未來的人工智能發(fā)展應(yīng)追求更高的能力密度,，以更低的成本實(shí)現(xiàn)大模型的高效發(fā)展,。類似于信息革命中的摩爾定律，大模型的能力密度也在以指數(shù)級增長,。這意味著每100天左右,，我們可以用一半的算力和參數(shù)實(shí)現(xiàn)相同的能力。

面向未來,，人工智能有三大主戰(zhàn)場：科學(xué)化技術(shù)方案,、計(jì)算系統(tǒng)的智能化以及廣譜化應(yīng)用。這些目標(biāo)都是為了讓通用人工智能達(dá)到頂尖水平,。中國團(tuán)隊(duì)如DeepSeek通過技術(shù)創(chuàng)新和長期積累,，在這一過程中取得了顯著成就，展現(xiàn)了中國在人工智能領(lǐng)域的快速追趕能力,。

觀眾提問環(huán)節(jié)中,，劉知遠(yuǎn)強(qiáng)調(diào)了DeepSeek V3和R1的關(guān)鍵技術(shù)及其成功因素,。他認(rèn)為,，DeepSeek的成功在于其技術(shù)理想主義、執(zhí)行力以及持續(xù)的創(chuàng)新努力,。DeepSeek的發(fā)展歷程表明,，只要有理想和執(zhí)行力，即使面臨困難也能取得突破,。國內(nèi)應(yīng)有更多的團(tuán)隊(duì)學(xué)習(xí)DeepSeek的理想,、堅(jiān)持和方法論，推動人工智能的進(jìn)一步發(fā)展,。

(責(zé)任編輯：于浩淙 zx0176)

關(guān)閉

DeepSeek出圈背后的邏輯 開源與高效性的勝利

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

DeepSeek出圈背后的邏輯開源與高效性的勝利