AI若要真正賦能全人類,,讓每個(gè)人都能用得上、用得起大模型和通用人工智能,,高效性是關(guān)鍵,。智能革命需要像信息革命一樣,不斷提高能力密度,,降低計(jì)算成本,,使大模型更加普惠。
清華大學(xué)長聘副教授劉知遠(yuǎn)在一場由中國計(jì)算機(jī)學(xué)會(huì)青年計(jì)算機(jī)科技論壇策劃的直播活動(dòng)中表示,,DeepSeek R1的開源標(biāo)志著人工智能領(lǐng)域再次迎來了類似2023年初ChatGPT的時(shí)刻,,展示了強(qiáng)大的深度思考能力。這場直播的主題為“夜話DeepSeek: 技術(shù)原理與未來方向”,,參與討論的還有復(fù)旦大學(xué)教授邱錫鵬和清華大學(xué)教授翟季冬等,。
劉知遠(yuǎn)認(rèn)為,DeepSeek V3展示了如何以十分之一甚至更少的成本達(dá)到GPT-4和GPT-4o水平的能力,。DeepSeek R1的成功在于它通過純粹的強(qiáng)化學(xué)習(xí)技術(shù)復(fù)現(xiàn)了OpenAI o1的深度推理能力,,并且開源并發(fā)布了詳細(xì)的技術(shù)介紹,。這不僅證明了OpenAI不開源、不公開技術(shù)細(xì)節(jié)且定價(jià)過高的策略存在缺陷,,還為行業(yè)做出了重要貢獻(xiàn),。
DeepSeek R1的訓(xùn)練流程有兩個(gè)亮點(diǎn):一是基于規(guī)則的方法實(shí)現(xiàn)了大規(guī)模強(qiáng)化學(xué)習(xí),二是將強(qiáng)化學(xué)習(xí)技術(shù)泛化到多個(gè)領(lǐng)域,,使其在實(shí)際應(yīng)用中表現(xiàn)出色,。這種泛化能力通過兩個(gè)階段實(shí)現(xiàn):首先生成帶有深度推理能力的數(shù)據(jù),然后通過強(qiáng)化學(xué)習(xí)進(jìn)一步訓(xùn)練,,最終得到具有強(qiáng)大泛化能力的強(qiáng)推理模型。