本地化部署DeepSeek是智商稅嗎改變AI格局的力量

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-02-19 10:32:07 網(wǎng)易

本地化部署DeepSeek是智商稅嗎,。蛇年除夕夜,，硅基流動創(chuàng)始人袁進(jìn)輝沒有留在飯桌旁，而是與技術(shù)團隊開會,，解決DeepSeek模型在國產(chǎn)芯片上的適配問題,。經(jīng)過三天三夜的努力,，他們聯(lián)合華為和DeepSeek，在2月1日上線了基于國產(chǎn)芯片服務(wù)的DeepSeek-V3和DeepSeek-R1,。此時,，距離DeepSeek AI智能助手同時登頂中美兩國App Store免費應(yīng)用榜不到一周時間。

過去三年,，每年春節(jié)前后都會迎來一波AI熱潮,。2023年，ChatGPT引爆了國內(nèi)大模型創(chuàng)業(yè)熱,。2024年,，視頻生成模型Sora震撼了所有人。今年,，主角變成了DeepSeek,。這家技術(shù)開放但行事低調(diào)的中國公司，以一己之力改變了AI大模型的世界格局,。

2024年底及2025年初,，DeepSeek相繼發(fā)布新一代MoE模型V3以及推理模型R1，憑借高性能,、低訓(xùn)練成本和對齊OpenAI o1兩項最直觀的表現(xiàn)，迅速引爆海內(nèi)外市場,。截至2月8日,，DeepSeek國內(nèi)APP端日活為3494萬，海外APP端日活達(dá)3685萬,，直追ChatGPT,。

最先受到影響的是硅谷科技巨頭Meta。原本Llama系列模型是全球開源大模型的領(lǐng)頭羊,，如今DeepSeek用不到其十分之一的成本做出了性能更好的模型,，并且免費開源，這讓Meta處境尷尬,。隨后,，英偉達(dá)也受到?jīng)_擊，市場擔(dān)憂DeepSeek帶來的低成本模式會減少算力需求,，導(dǎo)致英偉達(dá)市值一夜蒸發(fā)近6000億美元,，創(chuàng)下了美股單日最大跌幅紀(jì)錄。其他芯片股也隨之下跌。

與此同時,，幾乎所有與大模型行業(yè)有關(guān)的企業(yè)都在春節(jié)期間加入這場巨浪,，渴望承接背后的流量紅利。全球主流云廠商迅速跟進(jìn)部署DeepSeek API,；華為昇騰之外多家國產(chǎn)AI芯片廠商宣布適配DeepSeek不同尺寸模型,。國內(nèi)投資者的熱情也被點燃，由AI產(chǎn)業(yè)鏈公司構(gòu)成的DeepSeek概念股在二級市場連續(xù)多日普漲,。

然而,，大模型“六小虎”面臨的行業(yè)質(zhì)疑再度抬頭。一年前,，這些初創(chuàng)企業(yè)還被資本選中要跟OpenAI打擂臺,，但現(xiàn)在他們在影響力、技術(shù)認(rèn)可度和用戶規(guī)模等方面全面落后,。

DeepSeek的影響廣泛,，既是對手的威脅，也是行業(yè)的東風(fēng),。它已成為2025年的絕對主角,。

在今年的達(dá)沃斯論壇上，許多人向Fusion Fund創(chuàng)始合伙人張璐打聽起DeepSeek,。這家公司成立于2023年,，脫胎于知名量化基金幻方量化，目前未進(jìn)行任何外部融資,。創(chuàng)始人梁文鋒自去年年中起,，憑借DeepSeek-V2在MLA等方面的創(chuàng)新得到了業(yè)內(nèi)認(rèn)可，被視為一股“來自東方的神秘力量”,。

DeepSeek最近發(fā)布的V3和R1成為轉(zhuǎn)折點,。特別是R1完全復(fù)現(xiàn)了OpenAI o1推理模型能力，并且完全免費,。DeepSeek的創(chuàng)新包括模型壓縮,、多頭潛在注意力機制、混合專家模型和FP8混合精度訓(xùn)練等技術(shù),。硅谷的華人工程師們對此表示佩服,。

DeepSeek掀起的“AI降本浪潮”使得大家都能以更低的成本開發(fā)大模型。據(jù)官方論文介紹,，DeepSeek訓(xùn)練V3模型的成本約為557.6萬美元,，而Llama-3.1的訓(xùn)練成本高達(dá)數(shù)億美元。華爾街再次對AI算力泡沫心生恐慌,，擔(dān)心未來DeepSeek的低成本模式一旦推廣,，科技公司是否還需要大量購入英偉達(dá)先進(jìn)的AI芯片支持模型開發(fā),？

盡管如此，英偉達(dá)強調(diào)DeepSeek的進(jìn)步不僅不意味著算力過剩,，反而證明市場需要更多AI芯片,。事實上，微軟,、亞馬遜,、Meta、谷歌等巨頭都大幅增加了2025年的資本開支,，重點投資數(shù)據(jù)中心等AI基建項目,。

此外，DeepSeek的創(chuàng)新對國產(chǎn)算力芯片也是一大利好,。比如FP8混合精度算力訓(xùn)練方法在一定程度上彌補了國內(nèi)芯片硬件性能的不足,，提供了更多軟件算法的創(chuàng)新空間。

DeepSeek的成功也影響了國內(nèi)的大模型創(chuàng)業(yè)公司,，如“六小虎”,。這些公司在技術(shù)創(chuàng)新、產(chǎn)品認(rèn)知和企業(yè)影響力方面面臨巨大壓力,。一些公司甚至調(diào)整了項目的優(yōu)先級,，以應(yīng)對DeepSeek的競爭。

許多公司開始接入DeepSeek模型,，包括云廠商,、芯片廠商和其他大模型同行。騰訊元寶也在自有混元大模型的情況下接入了DeepSeek R1,。AI產(chǎn)業(yè)鏈的東風(fēng)已至,，更多的下游應(yīng)用公司也將搭上這股東風(fēng)，例如教育公司,、證券行業(yè)和手機廠商,。

DeepSeek的成功啟示了更多公司，尤其是在算法架構(gòu)和工程上的創(chuàng)新,。未來，更多公司將利用開源大模型以低成本服務(wù)市場,，催生大量獨立小廠的機會,。完全自動化而非co-pilot模式的應(yīng)用場景潛力更加突出。市場已經(jīng)傳出DeepSeek正在以80億美元估值融資的消息,，投資者將目光轉(zhuǎn)向AI產(chǎn)業(yè)鏈的其他變革機會,。

(責(zé)任編輯：盧其龍 CN070)

關(guān)閉

本地化部署DeepSeek是智商稅嗎 改變AI格局的力量

相關(guān)新聞

今日熱點

頻道熱點

本地化部署DeepSeek是智商稅嗎改變AI格局的力量