黑崎資本首席戰(zhàn)略官陳興文指出,DeepSeek的低成本意味著未來對(duì)推理算力的需求將成為主要驅(qū)動(dòng)力,,而英偉達(dá)等硬件商的傳統(tǒng)優(yōu)勢(shì)更多集中在訓(xùn)練側(cè),這可能對(duì)其市場(chǎng)地位和戰(zhàn)略布局產(chǎn)生影響,。DeepSeek通過MIT協(xié)議開源8個(gè)核心模型并全鏈路公開訓(xùn)練細(xì)節(jié),,打破了閉源體系的技術(shù)壟斷,,通過全球開發(fā)者社區(qū)的協(xié)同創(chuàng)新形成指數(shù)級(jí)迭代能力,。這種開源策略直接顛覆了硅谷“算力軍備競(jìng)賽”邏輯。
DeepSeek通過囤積高端芯片與優(yōu)化低性能芯片組合的雙軌策略,,結(jié)合強(qiáng)化學(xué)習(xí)替代監(jiān)督微調(diào)的技術(shù)突破,,成功將硬件約束轉(zhuǎn)化為算法創(chuàng)新驅(qū)動(dòng)力。這種逆境突圍重新定義了全球AI競(jìng)爭(zhēng)格局,,催生產(chǎn)業(yè)鏈價(jià)值重構(gòu),。在算力基建層面,數(shù)據(jù)中心向綠色高效轉(zhuǎn)型,,特定領(lǐng)域的行為數(shù)據(jù),、專業(yè)語(yǔ)料庫(kù)成為模型優(yōu)化的戰(zhàn)略資源,,驅(qū)動(dòng)數(shù)據(jù)采集、清洗,、標(biāo)注產(chǎn)業(yè)升級(jí),。更深遠(yuǎn)的影響體現(xiàn)在AI應(yīng)用生態(tài):開源模型大幅降低技術(shù)準(zhǔn)入門檻,使得中小企業(yè)能快速部署輕量化應(yīng)用,,加速AI能力向物聯(lián)網(wǎng)終端滲透,。
當(dāng)前全球算力市場(chǎng)正陷入“結(jié)構(gòu)性過剩與短缺并存”的困境。中國(guó)市場(chǎng)中,,大量跨界資本涌入智算中心建設(shè),,導(dǎo)致2024年全國(guó)建成超1.3萬個(gè)智算中心,但平均利用率不足30%,,千卡集群年虧損達(dá)2700萬元,。這種過剩本質(zhì)上是低端算力的盲目擴(kuò)張與高端智能算力短缺的疊加結(jié)果。實(shí)際需求端,,大模型訓(xùn)練所需的智能算力缺口達(dá)53%,,技術(shù)迭代速度遠(yuǎn)超硬件建設(shè)周期,設(shè)備貶值率超40%,。
DeepSeek僅用2048塊H800顯卡,、557萬美元成本便訓(xùn)練出性能對(duì)標(biāo)GPT-4的模型,通過MLA架構(gòu)和強(qiáng)化學(xué)習(xí)飛輪機(jī)制,,將訓(xùn)練效率提升至Meta Llama3的11倍,,百萬Token推理成本壓至0.55美元(僅為OpenAI的3.6%)。這種“算法優(yōu)化對(duì)沖硬件約束”的模式,,不僅證明尖端AI發(fā)展無需依賴無限堆砌算力,,更動(dòng)搖了美國(guó)技術(shù)霸權(quán)的根基。
中國(guó)AI大模型市場(chǎng)規(guī)模正在快速發(fā)展,。近日,,量化巨頭幻方量化旗下公司DeepSeek發(fā)布了推理大模型DeepSeek-R1
2025-01-27 08:58:14震動(dòng)科技界