本地化部署DeepSeek是智商稅嗎。蛇年除夕夜,,硅基流動創(chuàng)始人袁進輝沒有留在飯桌旁,,而是與技術團隊開會,,解決DeepSeek模型在國產(chǎn)芯片上的適配問題,。經(jīng)過三天三夜的努力,,他們聯(lián)合華為和DeepSeek,在2月1日上線了基于國產(chǎn)芯片服務的DeepSeek-V3和DeepSeek-R1,。此時,距離DeepSeek AI智能助手同時登頂中美兩國App Store免費應用榜不到一周時間,。
過去三年,,每年春節(jié)前后都會迎來一波AI熱潮。2023年,ChatGPT引爆了國內(nèi)大模型創(chuàng)業(yè)熱,。2024年,視頻生成模型Sora震撼了所有人。今年,主角變成了DeepSeek,。這家技術開放但行事低調(diào)的中國公司,,以一己之力改變了AI大模型的世界格局。
2024年底及2025年初,,DeepSeek相繼發(fā)布新一代MoE模型V3以及推理模型R1,,憑借高性能、低訓練成本和對齊OpenAI o1兩項最直觀的表現(xiàn),,迅速引爆海內(nèi)外市場,。截至2月8日,DeepSeek國內(nèi)APP端日活為3494萬,,海外APP端日活達3685萬,,直追ChatGPT。
最先受到影響的是硅谷科技巨頭Meta,。原本Llama系列模型是全球開源大模型的領頭羊,,如今DeepSeek用不到其十分之一的成本做出了性能更好的模型,并且免費開源,這讓Meta處境尷尬,。隨后,,英偉達也受到?jīng)_擊,市場擔憂DeepSeek帶來的低成本模式會減少算力需求,,導致英偉達市值一夜蒸發(fā)近6000億美元,,創(chuàng)下了美股單日最大跌幅紀錄。其他芯片股也隨之下跌,。
與此同時,,幾乎所有與大模型行業(yè)有關的企業(yè)都在春節(jié)期間加入這場巨浪,渴望承接背后的流量紅利,。全球主流云廠商迅速跟進部署DeepSeek API;華為昇騰之外多家國產(chǎn)AI芯片廠商宣布適配DeepSeek不同尺寸模型,。國內(nèi)投資者的熱情也被點燃,,由AI產(chǎn)業(yè)鏈公司構成的DeepSeek概念股在二級市場連續(xù)多日普漲。
然而,,大模型“六小虎”面臨的行業(yè)質(zhì)疑再度抬頭,。一年前,這些初創(chuàng)企業(yè)還被資本選中要跟OpenAI打擂臺,,但現(xiàn)在他們在影響力,、技術認可度和用戶規(guī)模等方面全面落后。
DeepSeek的影響廣泛,,既是對手的威脅,,也是行業(yè)的東風。它已成為2025年的絕對主角,。
在今年的達沃斯論壇上,,許多人向Fusion Fund創(chuàng)始合伙人張璐打聽起DeepSeek。這家公司成立于2023年,,脫胎于知名量化基金幻方量化,,目前未進行任何外部融資。創(chuàng)始人梁文鋒自去年年中起,,憑借DeepSeek-V2在MLA等方面的創(chuàng)新得到了業(yè)內(nèi)認可,,被視為一股“來自東方的神秘力量”。
DeepSeek最近發(fā)布的V3和R1成為轉折點,。特別是R1完全復現(xiàn)了OpenAI o1推理模型能力,,并且完全免費。DeepSeek的創(chuàng)新包括模型壓縮,、多頭潛在注意力機制,、混合專家模型和FP8混合精度訓練等技術。硅谷的華人工程師們對此表示佩服。
DeepSeek掀起的“AI降本浪潮”使得大家都能以更低的成本開發(fā)大模型,。據(jù)官方論文介紹,,DeepSeek訓練V3模型的成本約為557.6萬美元,而Llama-3.1的訓練成本高達數(shù)億美元,。華爾街再次對AI算力泡沫心生恐慌,,擔心未來DeepSeek的低成本模式一旦推廣,科技公司是否還需要大量購入英偉達先進的AI芯片支持模型開發(fā),?
盡管如此,,英偉達強調(diào)DeepSeek的進步不僅不意味著算力過剩,反而證明市場需要更多AI芯片,。事實上,,微軟、亞馬遜,、Meta,、谷歌等巨頭都大幅增加了2025年的資本開支,重點投資數(shù)據(jù)中心等AI基建項目,。
此外,,DeepSeek的創(chuàng)新對國產(chǎn)算力芯片也是一大利好。比如FP8混合精度算力訓練方法在一定程度上彌補了國內(nèi)芯片硬件性能的不足,,提供了更多軟件算法的創(chuàng)新空間,。
DeepSeek的成功也影響了國內(nèi)的大模型創(chuàng)業(yè)公司,如“六小虎”,。這些公司在技術創(chuàng)新,、產(chǎn)品認知和企業(yè)影響力方面面臨巨大壓力。一些公司甚至調(diào)整了項目的優(yōu)先級,,以應對DeepSeek的競爭,。
許多公司開始接入DeepSeek模型,包括云廠商,、芯片廠商和其他大模型同行,。騰訊元寶也在自有混元大模型的情況下接入了DeepSeek R1。AI產(chǎn)業(yè)鏈的東風已至,,更多的下游應用公司也將搭上這股東風,,例如教育公司、證券行業(yè)和手機廠商,。
DeepSeek的成功啟示了更多公司,,尤其是在算法架構和工程上的創(chuàng)新。未來,,更多公司將利用開源大模型以低成本服務市場,,催生大量獨立小廠的機會,。完全自動化而非co-pilot模式的應用場景潛力更加突出。市場已經(jīng)傳出DeepSeek正在以80億美元估值融資的消息,,投資者將目光轉向AI產(chǎn)業(yè)鏈的其他變革機會,。
近日,,又有近10家券商宣布完成了DeepSeek-R1的本地化部署。DeepSeek-R1是該系列模型的最新版本,。目前,,至少有16家券商在探索DeepSeek模型的應用
2025-02-10 10:50:23持續(xù)擴容