DeepSeek帶飛國(guó)內(nèi)AI大模型概念股低成本訓(xùn)練引關(guān)注(2)

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-28 07:28:24 每日經(jīng)濟(jì)新聞

黑崎資本首席戰(zhàn)略官陳興文指出，DeepSeek的低成本意味著未來(lái)對(duì)推理算力的需求將成為主要驅(qū)動(dòng)力,，而英偉達(dá)等硬件商的傳統(tǒng)優(yōu)勢(shì)更多集中在訓(xùn)練側(cè),，這可能對(duì)其市場(chǎng)地位和戰(zhàn)略布局產(chǎn)生影響。DeepSeek通過(guò)MIT協(xié)議開源8個(gè)核心模型并全鏈路公開訓(xùn)練細(xì)節(jié),，打破了閉源體系的技術(shù)壟斷,，通過(guò)全球開發(fā)者社區(qū)的協(xié)同創(chuàng)新形成指數(shù)級(jí)迭代能力。這種開源策略直接顛覆了硅谷“算力軍備競(jìng)賽”邏輯,。

DeepSeek通過(guò)囤積高端芯片與優(yōu)化低性能芯片組合的雙軌策略,，結(jié)合強(qiáng)化學(xué)習(xí)替代監(jiān)督微調(diào)的技術(shù)突破，成功將硬件約束轉(zhuǎn)化為算法創(chuàng)新驅(qū)動(dòng)力,。這種逆境突圍重新定義了全球AI競(jìng)爭(zhēng)格局,，催生產(chǎn)業(yè)鏈價(jià)值重構(gòu)。在算力基建層面,，數(shù)據(jù)中心向綠色高效轉(zhuǎn)型,，特定領(lǐng)域的行為數(shù)據(jù)、專業(yè)語(yǔ)料庫(kù)成為模型優(yōu)化的戰(zhàn)略資源,，驅(qū)動(dòng)數(shù)據(jù)采集,、清洗、標(biāo)注產(chǎn)業(yè)升級(jí),。更深遠(yuǎn)的影響體現(xiàn)在AI應(yīng)用生態(tài)：開源模型大幅降低技術(shù)準(zhǔn)入門檻,，使得中小企業(yè)能快速部署輕量化應(yīng)用,，加速AI能力向物聯(lián)網(wǎng)終端滲透。

當(dāng)前全球算力市場(chǎng)正陷入“結(jié)構(gòu)性過(guò)剩與短缺并存”的困境,。中國(guó)市場(chǎng)中,，大量跨界資本涌入智算中心建設(shè)，導(dǎo)致2024年全國(guó)建成超1.3萬(wàn)個(gè)智算中心,，但平均利用率不足30%,，千卡集群年虧損達(dá)2700萬(wàn)元,。這種過(guò)剩本質(zhì)上是低端算力的盲目擴(kuò)張與高端智能算力短缺的疊加結(jié)果,。實(shí)際需求端，大模型訓(xùn)練所需的智能算力缺口達(dá)53%,，技術(shù)迭代速度遠(yuǎn)超硬件建設(shè)周期,，設(shè)備貶值率超40%。

DeepSeek僅用2048塊H800顯卡,、557萬(wàn)美元成本便訓(xùn)練出性能對(duì)標(biāo)GPT-4的模型,，通過(guò)MLA架構(gòu)和強(qiáng)化學(xué)習(xí)飛輪機(jī)制，將訓(xùn)練效率提升至Meta Llama3的11倍,，百萬(wàn)Token推理成本壓至0.55美元（僅為OpenAI的3.6%）,。這種“算法優(yōu)化對(duì)沖硬件約束”的模式，不僅證明尖端AI發(fā)展無(wú)需依賴無(wú)限堆砌算力,，更動(dòng)搖了美國(guó)技術(shù)霸權(quán)的根基,。

首頁(yè)上一頁(yè)123 全文共 3 頁(yè)下一頁(yè)

關(guān)閉

DeepSeek帶飛國(guó)內(nèi)AI大模型概念股 低成本訓(xùn)練引關(guān)注(2)

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

DeepSeek帶飛國(guó)內(nèi)AI大模型概念股低成本訓(xùn)練引關(guān)注(2)