黑崎資本首席戰(zhàn)略官陳興文指出,,DeepSeek的低成本意味著未來(lái)對(duì)推理算力的需求將成為主要驅(qū)動(dòng)力,,而英偉達(dá)等硬件商的傳統(tǒng)優(yōu)勢(shì)更多集中在訓(xùn)練側(cè),,這可能對(duì)其市場(chǎng)地位和戰(zhàn)略布局產(chǎn)生影響,。DeepSeek通過(guò)MIT協(xié)議開(kāi)源8個(gè)核心模型并全鏈路公開(kāi)訓(xùn)練細(xì)節(jié),,打破了閉源體系的技術(shù)壟斷,,通過(guò)全球開(kāi)發(fā)者社區(qū)的協(xié)同創(chuàng)新形成指數(shù)級(jí)迭代能力。這種開(kāi)源策略直接顛覆了硅谷“算力軍備競(jìng)賽”邏輯,。
DeepSeek通過(guò)囤積高端芯片與優(yōu)化低性能芯片組合的雙軌策略,,結(jié)合強(qiáng)化學(xué)習(xí)替代監(jiān)督微調(diào)的技術(shù)突破,成功將硬件約束轉(zhuǎn)化為算法創(chuàng)新驅(qū)動(dòng)力,。這種逆境突圍重新定義了全球AI競(jìng)爭(zhēng)格局,,催生產(chǎn)業(yè)鏈價(jià)值重構(gòu)。在算力基建層面,,數(shù)據(jù)中心向綠色高效轉(zhuǎn)型,,特定領(lǐng)域的行為數(shù)據(jù)、專(zhuān)業(yè)語(yǔ)料庫(kù)成為模型優(yōu)化的戰(zhàn)略資源,,驅(qū)動(dòng)數(shù)據(jù)采集,、清洗、標(biāo)注產(chǎn)業(yè)升級(jí),。更深遠(yuǎn)的影響體現(xiàn)在AI應(yīng)用生態(tài):開(kāi)源模型大幅降低技術(shù)準(zhǔn)入門(mén)檻,,使得中小企業(yè)能快速部署輕量化應(yīng)用,加速AI能力向物聯(lián)網(wǎng)終端滲透,。
當(dāng)前全球算力市場(chǎng)正陷入“結(jié)構(gòu)性過(guò)剩與短缺并存”的困境,。中國(guó)市場(chǎng)中,大量跨界資本涌入智算中心建設(shè),,導(dǎo)致2024年全國(guó)建成超1.3萬(wàn)個(gè)智算中心,,但平均利用率不足30%,千卡集群年虧損達(dá)2700萬(wàn)元,。這種過(guò)剩本質(zhì)上是低端算力的盲目擴(kuò)張與高端智能算力短缺的疊加結(jié)果,。實(shí)際需求端,大模型訓(xùn)練所需的智能算力缺口達(dá)53%,,技術(shù)迭代速度遠(yuǎn)超硬件建設(shè)周期,,設(shè)備貶值率超40%。
DeepSeek僅用2048塊H800顯卡,、557萬(wàn)美元成本便訓(xùn)練出性能對(duì)標(biāo)GPT-4的模型,,通過(guò)MLA架構(gòu)和強(qiáng)化學(xué)習(xí)飛輪機(jī)制,將訓(xùn)練效率提升至Meta Llama3的11倍,百萬(wàn)Token推理成本壓至0.55美元(僅為OpenAI的3.6%),。這種“算法優(yōu)化對(duì)沖硬件約束”的模式,,不僅證明尖端AI發(fā)展無(wú)需依賴(lài)無(wú)限堆砌算力,更動(dòng)搖了美國(guó)技術(shù)霸權(quán)的根基,。
短短一個(gè)月內(nèi),中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:21:32DeepSeek大模型強(qiáng)在哪中國(guó)AI大模型市場(chǎng)規(guī)模正在快速發(fā)展,。近日,,量化巨頭幻方量化旗下公司DeepSeek發(fā)布了推理大模型DeepSeek-R1
2025-01-27 08:58:14震動(dòng)科技界