在DeepSeek開源之前,,整個(gè)2024年,,大模型行業(yè)都陷入了算力焦慮。高昂的算力成本讓許多企業(yè)望而卻步,,但隨著DeepSeek-R1模型的問(wèn)世和開源,,市場(chǎng)熱情被重新點(diǎn)燃。除了EP通信庫(kù)和FlashMLA的優(yōu)化,,DeepSeek還在多個(gè)方面進(jìn)行了算法創(chuàng)新,,顯著減少了模型對(duì)高算力硬件的依賴。例如,,通過(guò)混合專家架構(gòu)(MoE)和FP8訓(xùn)練技術(shù)優(yōu)化計(jì)算效率,,R1模型僅需2048塊GPU即可完成訓(xùn)練,,純算力訓(xùn)練成本降至500多萬(wàn)美元,遠(yuǎn)低于傳統(tǒng)大模型的數(shù)億美元投入,。
DeepSeek在MoE架構(gòu)方面的創(chuàng)新包括使用共享專家和路由專家兩種專家,,提升了模型訓(xùn)練效率。此外,,采用FP8混合精度技術(shù)替代傳統(tǒng)高精度運(yùn)算,,降低了內(nèi)存需求并提升了計(jì)算性能。DeepSeek還摒棄了傳統(tǒng)的監(jiān)督學(xué)習(xí)微調(diào),,采用純強(qiáng)化學(xué)習(xí)策略直接優(yōu)化推理能力,通過(guò)群體獎(jiǎng)勵(lì)優(yōu)化技術(shù)動(dòng)態(tài)調(diào)整模型輸出,。
這些革新將推動(dòng)算力需求的結(jié)構(gòu)性增長(zhǎng),,低成本模型加速了AI應(yīng)用普及,推理算力需求將呈指數(shù)級(jí)增長(zhǎng),。業(yè)內(nèi)多位專家認(rèn)為,,DeepSeek的技術(shù)突破不僅體現(xiàn)在性能指標(biāo)上,更通過(guò)效率與成本的平衡推動(dòng)了AI技術(shù)的普惠化,。據(jù)IDC數(shù)據(jù)顯示,,2024年全球人工智能服務(wù)器市場(chǎng)規(guī)模將達(dá)到1251億美元,2028年有望達(dá)到2227億美元,。
在中國(guó)市場(chǎng),,智能算力規(guī)模預(yù)計(jì)將在2028年達(dá)到2781.9EFLOPS。DeepSeek的出現(xiàn)帶動(dòng)了算力市場(chǎng)的變革和發(fā)展,,尤其是推理算力市場(chǎng)需求激增,。DeepSeek降低了大模型的應(yīng)用開發(fā)成本,讓更多中小用戶能夠接觸到這項(xiàng)技術(shù),。單機(jī)部署解決方案使得他們能夠以較低的成本和更簡(jiǎn)單的部署方式使用大模型,。
DeepSeek推動(dòng)了算力基礎(chǔ)設(shè)施的發(fā)展,各大廠商推出了相關(guān)的一體機(jī)產(chǎn)品,。例如,,聯(lián)想、浪潮云,、神州鯤泰等公司均推出了適配DeepSeek模型的一體機(jī),。算力服務(wù)模式也在從傳統(tǒng)IaaS向MaaS升級(jí),預(yù)置DeepSeek優(yōu)化模型提供端到端解決方案,,降低了客戶算力采購(gòu)復(fù)雜度,。目前正處于服務(wù)形態(tài)向MaaS轉(zhuǎn)變的初期,市場(chǎng)競(jìng)爭(zhēng)激烈,,未來(lái)將有更多好用普惠的MaaS支持AI創(chuàng)新落地,。
廣發(fā)證券指出,大模型的核心競(jìng)爭(zhēng)力在于算法,、算力和數(shù)據(jù)的協(xié)同進(jìn)化
2025-02-22 00:18:26券商