DeepSeek在MoE架構(gòu)方面的創(chuàng)新包括使用共享專家和路由專家兩種專家,,提升了模型訓(xùn)練效率。此外,,采用FP8混合精度技術(shù)替代傳統(tǒng)高精度運(yùn)算,,降低了內(nèi)存需求并提升了計(jì)算性能。DeepSeek還摒棄了傳統(tǒng)的監(jiān)督學(xué)習(xí)微調(diào),,采用純強(qiáng)化學(xué)習(xí)策略直接優(yōu)化推理能力,,通過群體獎(jiǎng)勵(lì)優(yōu)化技術(shù)動(dòng)態(tài)調(diào)整模型輸出。
這些革新將推動(dòng)算力需求的結(jié)構(gòu)性增長(zhǎng),,低成本模型加速了AI應(yīng)用普及,,推理算力需求將呈指數(shù)級(jí)增長(zhǎng)。業(yè)內(nèi)多位專家認(rèn)為,,DeepSeek的技術(shù)突破不僅體現(xiàn)在性能指標(biāo)上,,更通過效率與成本的平衡推動(dòng)了AI技術(shù)的普惠化。據(jù)IDC數(shù)據(jù)顯示,,2024年全球人工智能服務(wù)器市場(chǎng)規(guī)模將達(dá)到1251億美元,,2028年有望達(dá)到2227億美元。
在中國(guó)市場(chǎng),智能算力規(guī)模預(yù)計(jì)將在2028年達(dá)到2781.9EFLOPS,。DeepSeek的出現(xiàn)帶動(dòng)了算力市場(chǎng)的變革和發(fā)展,,尤其是推理算力市場(chǎng)需求激增。DeepSeek降低了大模型的應(yīng)用開發(fā)成本,,讓更多中小用戶能夠接觸到這項(xiàng)技術(shù),。單機(jī)部署解決方案使得他們能夠以較低的成本和更簡(jiǎn)單的部署方式使用大模型。
DeepSeek推動(dòng)了算力基礎(chǔ)設(shè)施的發(fā)展,,各大廠商推出了相關(guān)的一體機(jī)產(chǎn)品,。例如,聯(lián)想,、浪潮云,、神州鯤泰等公司均推出了適配DeepSeek模型的一體機(jī)。算力服務(wù)模式也在從傳統(tǒng)IaaS向MaaS升級(jí),,預(yù)置DeepSeek優(yōu)化模型提供端到端解決方案,,降低了客戶算力采購(gòu)復(fù)雜度。目前正處于服務(wù)形態(tài)向MaaS轉(zhuǎn)變的初期,,市場(chǎng)競(jìng)爭(zhēng)激烈,,未來將有更多好用普惠的MaaS支持AI創(chuàng)新落地。
廣發(fā)證券指出,,大模型的核心競(jìng)爭(zhēng)力在于算法,、算力和數(shù)據(jù)的協(xié)同進(jìn)化
2025-02-22 00:18:26券商