2月24日和25日,,DeepSeek先后宣布開源了FlashMLA代碼和DeepEP通信庫,致力于推動大模型的開源化進程,。DeepSeek-R1模型的問世與開源為大模型行業(yè)帶來了新的希望,,特別是在算力瓶頸方面。與其他廠商不同,,DeepSeek不僅追求算力疊加,,還通過算法創(chuàng)新解決了困擾行業(yè)的算力問題。
受DeepSeek影響,,國內算力產業(yè)格局發(fā)生變化,,AI服務器出貨量激增,能支持DeepSeek大模型應用的一體機也變得非常受歡迎,,各大廠商紛紛布局,,形成了競爭激烈的市場態(tài)勢。
自DeepSeek-R1 671B模型開源一個月后,,DeepSeek啟動了“Open Source Week”,,計劃在一周內開源五個代碼庫。2月24日,,DeepSeek開源了FlashMLA代碼,。這是一個MoE訓練加速框架,通過低秩矩陣壓縮KV緩存顯著減少內存占用和計算開銷,,支持千億參數模型的高效訓練,。浪潮信息相關負責人表示,相比主流的MHA和GQA算法,,FlashMLA在不降低計算精度的情況下大幅減少了推理時的KV緩存占用,,提升了推理效率。
FlashMLA專為英偉達Hopper GPU設計,,優(yōu)化了可變長度序列處理,,實現了接近H800理論峰值的性能。通過FlashMLA,,用戶可以將H800的性能提升到H100的水平,,同時降低了大模型部署成本,推動了大模型在各行業(yè)的落地,。此外,,FlashMLA的開源為國產GPU兼容CUDA生態(tài)提供了參考模板,促進了多廠商競爭格局的發(fā)展,。
緊接著,,2月25日,DeepSeek又宣布開源了DeepEP通信庫,。這是第一個用于MoE模型訓練和推理的開源EP通信庫,,支持低精度運算如FP8格式。DeepEP通過優(yōu)化All-to-All通信和支持NVLink/RDMA協(xié)議,,實現節(jié)點內外高效數據傳輸,,降低訓練和推理延遲。通過靈活的GPU資源調度,,DeepEP在通信過程中并行執(zhí)行計算任務,,顯著提升整體效率。
在DeepSeek開源之前,,整個2024年,,大模型行業(yè)都陷入了算力焦慮。高昂的算力成本讓許多企業(yè)望而卻步,,但隨著DeepSeek-R1模型的問世和開源,,市場熱情被重新點燃。除了EP通信庫和FlashMLA的優(yōu)化,,DeepSeek還在多個方面進行了算法創(chuàng)新,,顯著減少了模型對高算力硬件的依賴。例如,,通過混合專家架構(MoE)和FP8訓練技術優(yōu)化計算效率,,R1模型僅需2048塊GPU即可完成訓練,純算力訓練成本降至500多萬美元,,遠低于傳統(tǒng)大模型的數億美元投入,。
DeepSeek在MoE架構方面的創(chuàng)新包括使用共享專家和路由專家兩種專家,提升了模型訓練效率,。此外,,采用FP8混合精度技術替代傳統(tǒng)高精度運算,,降低了內存需求并提升了計算性能。DeepSeek還摒棄了傳統(tǒng)的監(jiān)督學習微調,,采用純強化學習策略直接優(yōu)化推理能力,,通過群體獎勵優(yōu)化技術動態(tài)調整模型輸出。
這些革新將推動算力需求的結構性增長,,低成本模型加速了AI應用普及,,推理算力需求將呈指數級增長。業(yè)內多位專家認為,,DeepSeek的技術突破不僅體現在性能指標上,,更通過效率與成本的平衡推動了AI技術的普惠化。據IDC數據顯示,,2024年全球人工智能服務器市場規(guī)模將達到1251億美元,,2028年有望達到2227億美元。
在中國市場,,智能算力規(guī)模預計將在2028年達到2781.9EFLOPS,。DeepSeek的出現帶動了算力市場的變革和發(fā)展,尤其是推理算力市場需求激增,。DeepSeek降低了大模型的應用開發(fā)成本,,讓更多中小用戶能夠接觸到這項技術。單機部署解決方案使得他們能夠以較低的成本和更簡單的部署方式使用大模型,。
DeepSeek推動了算力基礎設施的發(fā)展,,各大廠商推出了相關的一體機產品。例如,,聯想,、浪潮云、神州鯤泰等公司均推出了適配DeepSeek模型的一體機,。算力服務模式也在從傳統(tǒng)IaaS向MaaS升級,,預置DeepSeek優(yōu)化模型提供端到端解決方案,降低了客戶算力采購復雜度,。目前正處于服務形態(tài)向MaaS轉變的初期,,市場競爭激烈,未來將有更多好用普惠的MaaS支持AI創(chuàng)新落地,。
廣發(fā)證券指出,,大模型的核心競爭力在于算法,、算力和數據的協(xié)同進化
2025-02-22 00:18:26券商Deepseek對算力市場產生了顯著影響,。假期期間,,它給AI算力帶來了巨大沖擊,特別是在硬件廠商方面,。美股和A股市場上與算力訓練相關的公司股價出現下跌
2025-02-11 08:24:36DeepSeek沒能讓算力焦慮消失近期,,科技行業(yè)尤其是人工智能領域波動明顯,,多家企業(yè)成為投資者關注的焦點。節(jié)后機構調研活動頻繁,,斯菱股份在180多只被調研個股中脫穎而出,,有112家機構參與調研
2025-02-16 15:37:02DeepSeek概念透露1月27日,英偉達美股盤前深度下跌超過12%,,跌破了2024年12月17日的126.86美元低點,。黃仁勛可能沒想到,撼動英偉達產業(yè)邏輯的是一家中國私募
2025-01-29 02:35:57從DeepSeek看算力需求的潛在邏輯