在 R1-Zero 的基礎上,團隊采用了一個四階段的訓練方案,包括對合成推理數(shù)據(jù)進行監(jiān)督微調(diào),、大規(guī)模強化學習訓練,、拒絕采樣以及混合推理問題和一般偏好調(diào)整的強化學習訓練。這個過程不僅高效,,還保持了模型的可讀性和最終性能,。DeepSeek 通過創(chuàng)新方法,在有限計算資源下實現(xiàn)了這些突破,。微軟 AI 前沿研究實驗室首席研究員 Dimitris Papailiopoulos 表示,,R1 最令人驚訝的是其工程簡單性,追求準確答案而非詳細邏輯步驟顯著減少了計算時間,,同時保持高效率,。
盡管備受關(guān)注,DeepSeek仍然相對神秘,。公司成立于2023年7月,,創(chuàng)始人梁文鋒畢業(yè)于浙江大學信息與電子工程專業(yè),此前創(chuàng)立了管理約80億美元資產(chǎn)的對沖基金幻方量化,。他的目標是構(gòu)建通用人工智能(AGI),。在美國實施芯片出口管制之前,梁文鋒就收購了大量英偉達A100芯片,,為公司的技術(shù)突破奠定了基礎,。
面對芯片限制,DeepSeek 將挑戰(zhàn)轉(zhuǎn)化為創(chuàng)新機遇,。前 DeepSeek 員工 Zihan Wang 表示,,在公司工作期間能夠獲得充足的計算資源并自由實驗。這種創(chuàng)新精神體現(xiàn)在效率提升上,。梁文鋒承認中國公司在 AI 工程技術(shù)方面相對落后,,必須消耗兩倍的計算力才能達到相同結(jié)果。但團隊最終找到了減少內(nèi)存使用和加快計算速度的方法,,沒有明顯犧牲準確性,。
中國公司在AI領(lǐng)域形成了某種共識,不僅追求效率,,還在越來越多地擁抱開源原則,。阿里云已發(fā)布了超過100個新的開源AI模型,,支持29種語言,涵蓋編程和數(shù)學等各種應用,。全球AI大語言模型數(shù)量已達1,328個,,其中36%來自中國,使中國成為僅次于美國的第二大AI技術(shù)貢獻國,。
隨著DeepSeek等中國公司在AI領(lǐng)域的崛起,,全球AI競爭格局正在發(fā)生變化。如果中國公司能夠以更低的成本實現(xiàn)同等或更好的性能,,且這些模型大都開源,,美國公司賴以維持的技術(shù)優(yōu)勢和高估值可能會受到挑戰(zhàn)。不過,,現(xiàn)在就高呼“中國AI已經(jīng)超越美國”還為時過早,。清華大學計算機系長聘副教授劉知遠認為,中美AI差距正在縮小,,但中國仍在追趕階段,,接下來如何在迷霧中開拓新路才是更大的挑戰(zhàn)。
短短一個月內(nèi),,中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型——DeepSeek-V3和DeepSeek-R1
2025-01-26 10:34:01DeepSeek讓Meta深陷恐慌今年5月21日,,在湖北省荊門市公安局高新區(qū)·掇刀區(qū)分局,中青報·中青網(wǎng)記者見到了一大盒子期刊社和多省市新聞出版部門的假公章,,大約有100個。
2024-10-10 10:25:18起底山寨期刊億元論文生意