DeepSeek帶飛國內(nèi)AI大模型概念股低成本訓(xùn)練引關(guān)注

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-28 07:28:24 每日經(jīng)濟(jì)新聞

今日A股市場迎來龍年收官戰(zhàn),，三大指數(shù)走勢分化明顯。收盤時,，滬指跌0.06%,，創(chuàng)業(yè)板指跌2.73%，收報2063.82點,。滬深兩市成交額達(dá)到11179億元,，較上周五縮量1041億。

值得注意的是,，DeepSeek概念股領(lǐng)漲,，AI智能體、AI語料等概念股表現(xiàn)強(qiáng)勁,。與此同時,，算力板塊的銅高速連接、CPO等方向則紛紛領(lǐng)跌,，仕佳光子跌超16%,，兆龍互連、天孚通信等跌超10%,。

上述現(xiàn)象主要源于國產(chǎn)大模型DeepSeek在美區(qū)App Store免費榜登頂,，并在國內(nèi)App Store免費榜同樣位居第一。DeepSeek和ChatGPT躋身美區(qū)App Store免費榜前三,，展現(xiàn)出中國應(yīng)用程序的影響力,。DeepSeek推理大模型DeepSeek-R1發(fā)布已近一周，開源模型DeepSeek-V3也已發(fā)布近一個月,。DeepSeek-V3僅用2048塊H800 GPU完成6710億參數(shù)模型訓(xùn)練,，成本僅為557.6萬美元,，遠(yuǎn)低于其他頂級模型如GPT-4的10億美元。

受此利好影響,，國內(nèi)DeepSeek概念股受到追捧,，相關(guān)股東和合作伙伴也被市場挖掘出來炒作。AI大模型領(lǐng)域近年來吸引了大量資本投入,，盡管性能上取得了突破,，但仍面臨技術(shù)瓶頸與應(yīng)用落地方面的挑戰(zhàn)。大模型訓(xùn)練需要巨額算力支持,，當(dāng)前市場中算力資源的過剩使得成本問題凸顯。國際競爭與政策影響進(jìn)一步加劇了AI產(chǎn)業(yè)鏈的不確定性,。AI應(yīng)用后期的投資機(jī)會廣泛且多樣,，從算力基礎(chǔ)設(shè)施到行業(yè)應(yīng)用，再到生成式AI和端側(cè)AI,，均展現(xiàn)出強(qiáng)勁的增長潛力,。

1月25日，AMD宣布全新的DeepSeek-V3模型已集成至其Instinct GPU上,。DeepSeek-V3模型的突破顯著降低了AI培訓(xùn)成本,，使AMD GPU成為比英偉達(dá)更具成本效益的替代品。這一消息導(dǎo)致國內(nèi)A股市場算力硬件股持續(xù)走低,，銅高速連接,、CPO等方向領(lǐng)跌，仕佳光子跌超16%,，兆龍互連,、天孚通信等跌超10%。

OpenAI的成功在于規(guī)模制勝,，但這種模式帶來了高昂的訓(xùn)練成本,，不少公司難以承受。臉書母公司Meta成立了四個專門研究小組來研究量化巨頭幻方量化旗下的國產(chǎn)大模型DeepSeek的工作原理,，并基于此改進(jìn)旗下大模型Llama,。

黑崎資本首席戰(zhàn)略官陳興文指出，DeepSeek的低成本意味著未來對推理算力的需求將成為主要驅(qū)動力,，而英偉達(dá)等硬件商的傳統(tǒng)優(yōu)勢更多集中在訓(xùn)練側(cè),，這可能對其市場地位和戰(zhàn)略布局產(chǎn)生影響。DeepSeek通過MIT協(xié)議開源8個核心模型并全鏈路公開訓(xùn)練細(xì)節(jié),，打破了閉源體系的技術(shù)壟斷,，通過全球開發(fā)者社區(qū)的協(xié)同創(chuàng)新形成指數(shù)級迭代能力。這種開源策略直接顛覆了硅谷“算力軍備競賽”邏輯,。

DeepSeek通過囤積高端芯片與優(yōu)化低性能芯片組合的雙軌策略,，結(jié)合強(qiáng)化學(xué)習(xí)替代監(jiān)督微調(diào)的技術(shù)突破,，成功將硬件約束轉(zhuǎn)化為算法創(chuàng)新驅(qū)動力。這種逆境突圍重新定義了全球AI競爭格局,，催生產(chǎn)業(yè)鏈價值重構(gòu),。在算力基建層面，數(shù)據(jù)中心向綠色高效轉(zhuǎn)型,，特定領(lǐng)域的行為數(shù)據(jù)、專業(yè)語料庫成為模型優(yōu)化的戰(zhàn)略資源,，驅(qū)動數(shù)據(jù)采集、清洗,、標(biāo)注產(chǎn)業(yè)升級,。更深遠(yuǎn)的影響體現(xiàn)在AI應(yīng)用生態(tài)：開源模型大幅降低技術(shù)準(zhǔn)入門檻，使得中小企業(yè)能快速部署輕量化應(yīng)用,，加速AI能力向物聯(lián)網(wǎng)終端滲透,。

當(dāng)前全球算力市場正陷入“結(jié)構(gòu)性過剩與短缺并存”的困境。中國市場中,，大量跨界資本涌入智算中心建設(shè),，導(dǎo)致2024年全國建成超1.3萬個智算中心，但平均利用率不足30%,，千卡集群年虧損達(dá)2700萬元。這種過剩本質(zhì)上是低端算力的盲目擴(kuò)張與高端智能算力短缺的疊加結(jié)果,。實際需求端,，大模型訓(xùn)練所需的智能算力缺口達(dá)53%，技術(shù)迭代速度遠(yuǎn)超硬件建設(shè)周期,，設(shè)備貶值率超40%,。

DeepSeek僅用2048塊H800顯卡、557萬美元成本便訓(xùn)練出性能對標(biāo)GPT-4的模型,，通過MLA架構(gòu)和強(qiáng)化學(xué)習(xí)飛輪機(jī)制,，將訓(xùn)練效率提升至Meta Llama3的11倍，百萬Token推理成本壓至0.55美元（僅為OpenAI的3.6%）,。這種“算法優(yōu)化對沖硬件約束”的模式,，不僅證明尖端AI發(fā)展無需依賴無限堆砌算力，更動搖了美國技術(shù)霸權(quán)的根基,。

DeepSeek的崛起被稱為“美股最大威脅”,，源于其對美國AI商業(yè)邏輯與芯片霸權(quán)的雙重解構(gòu),。技術(shù)層面,，其開源策略形成全球開發(fā)者協(xié)同創(chuàng)新的“開源飛輪”,，吸引Meta,、Google工程師反向研究其RL技術(shù)框架。產(chǎn)業(yè)層面,，其通過算法創(chuàng)新削弱了英偉達(dá)高端GPU的不可替代性，引發(fā)英偉達(dá)股價單日暴跌5.8%,，連帶日本芯片測試設(shè)備商Advantest市值蒸發(fā)8.6%,。地緣博弈層面,，DeepSeek驗證了中國AI企業(yè)“用架構(gòu)創(chuàng)新壓縮技術(shù)代差”的可能性,，紐約時報評價其“使美國芯片封鎖淪為戰(zhàn)略敗筆”。

這場變革的本質(zhì)是AI競爭從“資本密集型”向“創(chuàng)新密集型”的范式遷移,。短期算力過剩實則是低端產(chǎn)能出清的前奏,，DeepSeek的技術(shù)路徑預(yù)示未來算力市場將兩極分化：通用算力加速淘汰，智能算力向算法優(yōu)勢企業(yè)集中,。

(責(zé)任編輯：于浩淙 zx0176)

關(guān)閉

DeepSeek帶飛國內(nèi)AI大模型概念股 低成本訓(xùn)練引關(guān)注

相關(guān)新聞

今日熱點

頻道熱點

DeepSeek帶飛國內(nèi)AI大模型概念股低成本訓(xùn)練引關(guān)注