今日A股市場(chǎng)迎來(lái)龍年收官戰(zhàn),三大指數(shù)走勢(shì)分化明顯,。收盤(pán)時(shí),,滬指跌0.06%,,創(chuàng)業(yè)板指跌2.73%,,收?qǐng)?bào)2063.82點(diǎn)。滬深兩市成交額達(dá)到11179億元,,較上周五縮量1041億,。
值得注意的是,DeepSeek概念股領(lǐng)漲,,AI智能體,、AI語(yǔ)料等概念股表現(xiàn)強(qiáng)勁。與此同時(shí),,算力板塊的銅高速連接,、CPO等方向則紛紛領(lǐng)跌,仕佳光子跌超16%,,兆龍互連,、天孚通信等跌超10%。
上述現(xiàn)象主要源于國(guó)產(chǎn)大模型DeepSeek在美區(qū)App Store免費(fèi)榜登頂,,并在國(guó)內(nèi)App Store免費(fèi)榜同樣位居第一,。DeepSeek和ChatGPT躋身美區(qū)App Store免費(fèi)榜前三,展現(xiàn)出中國(guó)應(yīng)用程序的影響力,。DeepSeek推理大模型DeepSeek-R1發(fā)布已近一周,,開(kāi)源模型DeepSeek-V3也已發(fā)布近一個(gè)月。DeepSeek-V3僅用2048塊H800 GPU完成6710億參數(shù)模型訓(xùn)練,,成本僅為557.6萬(wàn)美元,,遠(yuǎn)低于其他頂級(jí)模型如GPT-4的10億美元。
受此利好影響,,國(guó)內(nèi)DeepSeek概念股受到追捧,,相關(guān)股東和合作伙伴也被市場(chǎng)挖掘出來(lái)炒作。AI大模型領(lǐng)域近年來(lái)吸引了大量資本投入,,盡管性能上取得了突破,,但仍面臨技術(shù)瓶頸與應(yīng)用落地方面的挑戰(zhàn),。大模型訓(xùn)練需要巨額算力支持,,當(dāng)前市場(chǎng)中算力資源的過(guò)剩使得成本問(wèn)題凸顯。國(guó)際競(jìng)爭(zhēng)與政策影響進(jìn)一步加劇了AI產(chǎn)業(yè)鏈的不確定性,。AI應(yīng)用后期的投資機(jī)會(huì)廣泛且多樣,,從算力基礎(chǔ)設(shè)施到行業(yè)應(yīng)用,再到生成式AI和端側(cè)AI,,均展現(xiàn)出強(qiáng)勁的增長(zhǎng)潛力,。
1月25日,,AMD宣布全新的DeepSeek-V3模型已集成至其Instinct GPU上,。DeepSeek-V3模型的突破顯著降低了AI培訓(xùn)成本,使AMD GPU成為比英偉達(dá)更具成本效益的替代品,。這一消息導(dǎo)致國(guó)內(nèi)A股市場(chǎng)算力硬件股持續(xù)走低,,銅高速連接、CPO等方向領(lǐng)跌,,仕佳光子跌超16%,,兆龍互連、天孚通信等跌超10%,。
OpenAI的成功在于規(guī)模制勝,,但這種模式帶來(lái)了高昂的訓(xùn)練成本,不少公司難以承受,。臉書(shū)母公司Meta成立了四個(gè)專(zhuān)門(mén)研究小組來(lái)研究量化巨頭幻方量化旗下的國(guó)產(chǎn)大模型DeepSeek的工作原理,,并基于此改進(jìn)旗下大模型Llama。
黑崎資本首席戰(zhàn)略官陳興文指出,,DeepSeek的低成本意味著未來(lái)對(duì)推理算力的需求將成為主要驅(qū)動(dòng)力,,而英偉達(dá)等硬件商的傳統(tǒng)優(yōu)勢(shì)更多集中在訓(xùn)練側(cè),這可能對(duì)其市場(chǎng)地位和戰(zhàn)略布局產(chǎn)生影響,。DeepSeek通過(guò)MIT協(xié)議開(kāi)源8個(gè)核心模型并全鏈路公開(kāi)訓(xùn)練細(xì)節(jié),,打破了閉源體系的技術(shù)壟斷,通過(guò)全球開(kāi)發(fā)者社區(qū)的協(xié)同創(chuàng)新形成指數(shù)級(jí)迭代能力,。這種開(kāi)源策略直接顛覆了硅谷“算力軍備競(jìng)賽”邏輯,。
DeepSeek通過(guò)囤積高端芯片與優(yōu)化低性能芯片組合的雙軌策略,結(jié)合強(qiáng)化學(xué)習(xí)替代監(jiān)督微調(diào)的技術(shù)突破,,成功將硬件約束轉(zhuǎn)化為算法創(chuàng)新驅(qū)動(dòng)力,。這種逆境突圍重新定義了全球AI競(jìng)爭(zhēng)格局,催生產(chǎn)業(yè)鏈價(jià)值重構(gòu),。在算力基建層面,,數(shù)據(jù)中心向綠色高效轉(zhuǎn)型,特定領(lǐng)域的行為數(shù)據(jù),、專(zhuān)業(yè)語(yǔ)料庫(kù)成為模型優(yōu)化的戰(zhàn)略資源,,驅(qū)動(dòng)數(shù)據(jù)采集,、清洗、標(biāo)注產(chǎn)業(yè)升級(jí),。更深遠(yuǎn)的影響體現(xiàn)在AI應(yīng)用生態(tài):開(kāi)源模型大幅降低技術(shù)準(zhǔn)入門(mén)檻,,使得中小企業(yè)能快速部署輕量化應(yīng)用,加速AI能力向物聯(lián)網(wǎng)終端滲透,。
當(dāng)前全球算力市場(chǎng)正陷入“結(jié)構(gòu)性過(guò)剩與短缺并存”的困境,。中國(guó)市場(chǎng)中,大量跨界資本涌入智算中心建設(shè),,導(dǎo)致2024年全國(guó)建成超1.3萬(wàn)個(gè)智算中心,,但平均利用率不足30%,千卡集群年虧損達(dá)2700萬(wàn)元,。這種過(guò)剩本質(zhì)上是低端算力的盲目擴(kuò)張與高端智能算力短缺的疊加結(jié)果,。實(shí)際需求端,,大模型訓(xùn)練所需的智能算力缺口達(dá)53%,技術(shù)迭代速度遠(yuǎn)超硬件建設(shè)周期,,設(shè)備貶值率超40%,。
DeepSeek僅用2048塊H800顯卡,、557萬(wàn)美元成本便訓(xùn)練出性能對(duì)標(biāo)GPT-4的模型,,通過(guò)MLA架構(gòu)和強(qiáng)化學(xué)習(xí)飛輪機(jī)制,將訓(xùn)練效率提升至Meta Llama3的11倍,,百萬(wàn)Token推理成本壓至0.55美元(僅為OpenAI的3.6%),。這種“算法優(yōu)化對(duì)沖硬件約束”的模式,不僅證明尖端AI發(fā)展無(wú)需依賴(lài)無(wú)限堆砌算力,,更動(dòng)搖了美國(guó)技術(shù)霸權(quán)的根基,。
DeepSeek的崛起被稱(chēng)為“美股最大威脅”,源于其對(duì)美國(guó)AI商業(yè)邏輯與芯片霸權(quán)的雙重解構(gòu),。技術(shù)層面,,其開(kāi)源策略形成全球開(kāi)發(fā)者協(xié)同創(chuàng)新的“開(kāi)源飛輪”,吸引Meta,、Google工程師反向研究其RL技術(shù)框架。產(chǎn)業(yè)層面,,其通過(guò)算法創(chuàng)新削弱了英偉達(dá)高端GPU的不可替代性,引發(fā)英偉達(dá)股價(jià)單日暴跌5.8%,,連帶日本芯片測(cè)試設(shè)備商Advantest市值蒸發(fā)8.6%,。地緣博弈層面,DeepSeek驗(yàn)證了中國(guó)AI企業(yè)“用架構(gòu)創(chuàng)新壓縮技術(shù)代差”的可能性,紐約時(shí)報(bào)評(píng)價(jià)其“使美國(guó)芯片封鎖淪為戰(zhàn)略敗筆”,。
這場(chǎng)變革的本質(zhì)是AI競(jìng)爭(zhēng)從“資本密集型”向“創(chuàng)新密集型”的范式遷移。短期算力過(guò)剩實(shí)則是低端產(chǎn)能出清的前奏,,DeepSeek的技術(shù)路徑預(yù)示未來(lái)算力市場(chǎng)將兩極分化:通用算力加速淘汰,智能算力向算法優(yōu)勢(shì)企業(yè)集中,。
中國(guó)AI大模型市場(chǎng)規(guī)模正在快速發(fā)展,。近日,量化巨頭幻方量化旗下公司DeepSeek發(fā)布了推理大模型DeepSeek-R1
2025-01-27 08:58:14震動(dòng)科技界