蛇年除夕夜,,硅基流動(dòng)創(chuàng)始人袁進(jìn)輝沒(méi)有留在飯桌上,而是抓緊時(shí)間與技術(shù)團(tuán)隊(duì)開(kāi)會(huì),,解決DeepSeek模型在國(guó)產(chǎn)芯片上的適配問(wèn)題。經(jīng)過(guò)三天三夜的努力,他們聯(lián)合華為和DeepSeek,在2月1日上線了基于國(guó)產(chǎn)芯片服務(wù)的DeepSeek-V3和DeepSeek-R1。此時(shí),,距離DeepSeek AI智能助手登頂中美兩國(guó)App Store免費(fèi)應(yīng)用榜還不到一周。
過(guò)去三年,,每年春節(jié)前后都會(huì)迎來(lái)一波AI熱潮,。2023年,ChatGPT引爆了國(guó)內(nèi)大模型創(chuàng)業(yè)熱,;2024年,,視頻生成模型Sora震撼所有人;今年,,主角變成了DeepSeek,。這家低調(diào)但技術(shù)開(kāi)放的中國(guó)公司改變了AI大模型的世界格局。
2024年底及2025年初,,DeepSeek發(fā)布新一代MoE模型V3以及推理模型R1,,憑借高性能、低訓(xùn)練成本和對(duì)齊OpenAI o1兩項(xiàng)表現(xiàn),,迅速走紅,。截至2月8日,DeepSeek國(guó)內(nèi)APP端日活為3494萬(wàn),,海外APP端日活達(dá)3685萬(wàn),,直追ChatGPT。
這一變化首先沖擊了Meta,,其Llama系列模型曾是全球開(kāi)源大模型的領(lǐng)頭羊,。如今,DeepSeek用更低的成本做出了更好的模型并免費(fèi)開(kāi)源,,讓Meta處境尷尬,。隨后英偉達(dá)也受到?jīng)_擊,市場(chǎng)擔(dān)憂DeepSeek帶來(lái)的低成本模式會(huì)減少算力需求,,導(dǎo)致英偉達(dá)市值一夜蒸發(fā)近6000億美元,。
幾乎所有與大模型行業(yè)相關(guān)的企業(yè)都在春節(jié)忙著加入這場(chǎng)巨浪,希望承接背后的流量紅利,。全球主流云廠商迅速跟進(jìn)部署DeepSeek API,,多家國(guó)產(chǎn)AI芯片廠商宣布適配DeepSeek不同尺寸模型。國(guó)內(nèi)投資者的熱情也被點(diǎn)燃,,由AI產(chǎn)業(yè)鏈公司構(gòu)成的DeepSeek概念股在二級(jí)市場(chǎng)連續(xù)多日普漲,。
而在聚光燈外,,大模型“六小虎”面臨的行業(yè)質(zhì)疑再度抬頭,。一年前,,這些初創(chuàng)公司被資本選中要跟OpenAI打擂臺(tái),但現(xiàn)在它們?cè)诙鄠€(gè)維度全面落后,。