中科曙光國(guó)家先進(jìn)計(jì)算產(chǎn)業(yè)創(chuàng)新中心有限公司宣布,海光信息技術(shù)團(tuán)隊(duì)成功完成DeepSeek V3和R1模型與海光DCU(深度計(jì)算單元)的國(guó)產(chǎn)化適配,,并正式上線,。用戶可以在“光合開(kāi)發(fā)者社區(qū)”的“光源”板塊訪問(wèn)并下載相關(guān)模型,或登錄光源官網(wǎng)搜索“DeepSeek”,,基于DCU平臺(tái)部署和使用這些模型,。
DeepSeek V3和R1模型基于Transformer架構(gòu),采用了Multi-Head Latent Attention(MLA)和DeepSeek MoE兩大核心技術(shù),。MLA通過(guò)減少KV緩存顯著降低了內(nèi)存占用,,提升了推理效率;DeepSeek MoE則通過(guò)輔助損失實(shí)現(xiàn)了專家負(fù)載的智能平衡,,進(jìn)一步優(yōu)化了模型性能,。
DCU是海光信息推出的高性能GPGPU架構(gòu)AI加速卡,致力于為行業(yè)客戶提供自主可控的全精度通用AI加速計(jì)算解決方案,。目前,,DCU已在科教、金融,、醫(yī)療,、政務(wù),、智算中心等多個(gè)領(lǐng)域?qū)崿F(xiàn)規(guī)?;瘧?yīng)用。
AI芯片巨頭英偉達(dá)公司發(fā)表聲明,,稱DeepSeek發(fā)布的新模型是一項(xiàng)出色的AI進(jìn)步,,符合美國(guó)技術(shù)出口管制規(guī)定
2025-01-29 05:00:03英偉達(dá)回應(yīng)DeepSeek模型