本地化部署DeepSeek是智商稅嗎,。蛇年除夕夜,,硅基流動創(chuàng)始人袁進(jìn)輝沒有留在飯桌旁,而是與技術(shù)團隊開會,,解決DeepSeek模型在國產(chǎn)芯片上的適配問題,。經(jīng)過三天三夜的努力,,他們聯(lián)合華為和DeepSeek,在2月1日上線了基于國產(chǎn)芯片服務(wù)的DeepSeek-V3和DeepSeek-R1,。此時,,距離DeepSeek AI智能助手同時登頂中美兩國App Store免費應(yīng)用榜不到一周時間。
過去三年,,每年春節(jié)前后都會迎來一波AI熱潮,。2023年,ChatGPT引爆了國內(nèi)大模型創(chuàng)業(yè)熱,。2024年,,視頻生成模型Sora震撼了所有人。今年,,主角變成了DeepSeek,。這家技術(shù)開放但行事低調(diào)的中國公司,以一己之力改變了AI大模型的世界格局,。
2024年底及2025年初,,DeepSeek相繼發(fā)布新一代MoE模型V3以及推理模型R1,憑借高性能,、低訓(xùn)練成本和對齊OpenAI o1兩項最直觀的表現(xiàn),迅速引爆海內(nèi)外市場,。截至2月8日,,DeepSeek國內(nèi)APP端日活為3494萬,海外APP端日活達(dá)3685萬,,直追ChatGPT,。
最先受到影響的是硅谷科技巨頭Meta。原本Llama系列模型是全球開源大模型的領(lǐng)頭羊,,如今DeepSeek用不到其十分之一的成本做出了性能更好的模型,,并且免費開源,這讓Meta處境尷尬,。隨后,,英偉達(dá)也受到?jīng)_擊,市場擔(dān)憂DeepSeek帶來的低成本模式會減少算力需求,,導(dǎo)致英偉達(dá)市值一夜蒸發(fā)近6000億美元,,創(chuàng)下了美股單日最大跌幅紀(jì)錄。其他芯片股也隨之下跌。
與此同時,,幾乎所有與大模型行業(yè)有關(guān)的企業(yè)都在春節(jié)期間加入這場巨浪,,渴望承接背后的流量紅利。全球主流云廠商迅速跟進(jìn)部署DeepSeek API,;華為昇騰之外多家國產(chǎn)AI芯片廠商宣布適配DeepSeek不同尺寸模型,。國內(nèi)投資者的熱情也被點燃,由AI產(chǎn)業(yè)鏈公司構(gòu)成的DeepSeek概念股在二級市場連續(xù)多日普漲,。
然而,,大模型“六小虎”面臨的行業(yè)質(zhì)疑再度抬頭。一年前,,這些初創(chuàng)企業(yè)還被資本選中要跟OpenAI打擂臺,,但現(xiàn)在他們在影響力、技術(shù)認(rèn)可度和用戶規(guī)模等方面全面落后,。
DeepSeek的影響廣泛,,既是對手的威脅,也是行業(yè)的東風(fēng),。它已成為2025年的絕對主角,。
在今年的達(dá)沃斯論壇上,許多人向Fusion Fund創(chuàng)始合伙人張璐打聽起DeepSeek,。這家公司成立于2023年,,脫胎于知名量化基金幻方量化,目前未進(jìn)行任何外部融資,。創(chuàng)始人梁文鋒自去年年中起,,憑借DeepSeek-V2在MLA等方面的創(chuàng)新得到了業(yè)內(nèi)認(rèn)可,被視為一股“來自東方的神秘力量”,。
DeepSeek最近發(fā)布的V3和R1成為轉(zhuǎn)折點,。特別是R1完全復(fù)現(xiàn)了OpenAI o1推理模型能力,并且完全免費,。DeepSeek的創(chuàng)新包括模型壓縮,、多頭潛在注意力機制、混合專家模型和FP8混合精度訓(xùn)練等技術(shù),。硅谷的華人工程師們對此表示佩服,。
DeepSeek掀起的“AI降本浪潮”使得大家都能以更低的成本開發(fā)大模型。據(jù)官方論文介紹,,DeepSeek訓(xùn)練V3模型的成本約為557.6萬美元,,而Llama-3.1的訓(xùn)練成本高達(dá)數(shù)億美元。華爾街再次對AI算力泡沫心生恐慌,,擔(dān)心未來DeepSeek的低成本模式一旦推廣,,科技公司是否還需要大量購入英偉達(dá)先進(jìn)的AI芯片支持模型開發(fā),?
盡管如此,英偉達(dá)強調(diào)DeepSeek的進(jìn)步不僅不意味著算力過剩,,反而證明市場需要更多AI芯片,。事實上,微軟,、亞馬遜,、Meta、谷歌等巨頭都大幅增加了2025年的資本開支,,重點投資數(shù)據(jù)中心等AI基建項目,。
此外,DeepSeek的創(chuàng)新對國產(chǎn)算力芯片也是一大利好,。比如FP8混合精度算力訓(xùn)練方法在一定程度上彌補了國內(nèi)芯片硬件性能的不足,,提供了更多軟件算法的創(chuàng)新空間。
DeepSeek的成功也影響了國內(nèi)的大模型創(chuàng)業(yè)公司,,如“六小虎”,。這些公司在技術(shù)創(chuàng)新、產(chǎn)品認(rèn)知和企業(yè)影響力方面面臨巨大壓力,。一些公司甚至調(diào)整了項目的優(yōu)先級,,以應(yīng)對DeepSeek的競爭。
許多公司開始接入DeepSeek模型,,包括云廠商,、芯片廠商和其他大模型同行。騰訊元寶也在自有混元大模型的情況下接入了DeepSeek R1,。AI產(chǎn)業(yè)鏈的東風(fēng)已至,,更多的下游應(yīng)用公司也將搭上這股東風(fēng),例如教育公司,、證券行業(yè)和手機廠商,。
DeepSeek的成功啟示了更多公司,尤其是在算法架構(gòu)和工程上的創(chuàng)新,。未來,更多公司將利用開源大模型以低成本服務(wù)市場,,催生大量獨立小廠的機會,。完全自動化而非co-pilot模式的應(yīng)用場景潛力更加突出。市場已經(jīng)傳出DeepSeek正在以80億美元估值融資的消息,,投資者將目光轉(zhuǎn)向AI產(chǎn)業(yè)鏈的其他變革機會,。
近日,,又有近10家券商宣布完成了DeepSeek-R1的本地化部署,。DeepSeek-R1是該系列模型的最新版本。目前,,至少有16家券商在探索DeepSeek模型的應(yīng)用
2025-02-10 10:50:23持續(xù)擴容