中科曙光國家先進計算產(chǎn)業(yè)創(chuàng)新中心有限公司宣布,海光信息技術(shù)團隊成功完成DeepSeek V3和R1模型與海光DCU(深度計算單元)的國產(chǎn)化適配,,并正式上線,。用戶可以在“光合開發(fā)者社區(qū)”的“光源”板塊訪問并下載相關(guān)模型,或登錄光源官網(wǎng)搜索“DeepSeek”,,基于DCU平臺部署和使用這些模型,。
DeepSeek V3和R1模型基于Transformer架構(gòu),采用了Multi-Head Latent Attention(MLA)和DeepSeek MoE兩大核心技術(shù),。MLA通過減少KV緩存顯著降低了內(nèi)存占用,,提升了推理效率;DeepSeek MoE則通過輔助損失實現(xiàn)了專家負載的智能平衡,,進一步優(yōu)化了模型性能,。
DCU是海光信息推出的高性能GPGPU架構(gòu)AI加速卡,,致力于為行業(yè)客戶提供自主可控的全精度通用AI加速計算解決方案。目前,,DCU已在科教,、金融、醫(yī)療,、政務(wù),、智算中心等多個領(lǐng)域?qū)崿F(xiàn)規(guī)模化應(yīng)用,。
AI芯片巨頭英偉達公司發(fā)表聲明,稱DeepSeek發(fā)布的新模型是一項出色的AI進步,,符合美國技術(shù)出口管制規(guī)定
2025-01-29 05:00:03英偉達回應(yīng)DeepSeek模型