然而,大模型“六小虎”面臨的行業(yè)質(zhì)疑再度抬頭。一年前,,這些初創(chuàng)企業(yè)還被資本選中要跟OpenAI打擂臺(tái),但現(xiàn)在他們在影響力,、技術(shù)認(rèn)可度和用戶規(guī)模等方面全面落后。
DeepSeek的影響廣泛,,既是對(duì)手的威脅,,也是行業(yè)的東風(fēng)。它已成為2025年的絕對(duì)主角,。
在今年的達(dá)沃斯論壇上,,許多人向Fusion Fund創(chuàng)始合伙人張璐打聽起DeepSeek。這家公司成立于2023年,,脫胎于知名量化基金幻方量化,,目前未進(jìn)行任何外部融資。創(chuàng)始人梁文鋒自去年年中起,,憑借DeepSeek-V2在MLA等方面的創(chuàng)新得到了業(yè)內(nèi)認(rèn)可,,被視為一股“來自東方的神秘力量”。
DeepSeek最近發(fā)布的V3和R1成為轉(zhuǎn)折點(diǎn),。特別是R1完全復(fù)現(xiàn)了OpenAI o1推理模型能力,,并且完全免費(fèi)。DeepSeek的創(chuàng)新包括模型壓縮,、多頭潛在注意力機(jī)制,、混合專家模型和FP8混合精度訓(xùn)練等技術(shù)。硅谷的華人工程師們對(duì)此表示佩服,。
DeepSeek掀起的“AI降本浪潮”使得大家都能以更低的成本開發(fā)大模型。據(jù)官方論文介紹,,DeepSeek訓(xùn)練V3模型的成本約為557.6萬美元,,而Llama-3.1的訓(xùn)練成本高達(dá)數(shù)億美元。華爾街再次對(duì)AI算力泡沫心生恐慌,擔(dān)心未來DeepSeek的低成本模式一旦推廣,,科技公司是否還需要大量購入英偉達(dá)先進(jìn)的AI芯片支持模型開發(fā),?
盡管如此,英偉達(dá)強(qiáng)調(diào)DeepSeek的進(jìn)步不僅不意味著算力過剩,,反而證明市場需要更多AI芯片,。事實(shí)上,微軟,、亞馬遜,、Meta、谷歌等巨頭都大幅增加了2025年的資本開支,,重點(diǎn)投資數(shù)據(jù)中心等AI基建項(xiàng)目,。
此外,DeepSeek的創(chuàng)新對(duì)國產(chǎn)算力芯片也是一大利好,。比如FP8混合精度算力訓(xùn)練方法在一定程度上彌補(bǔ)了國內(nèi)芯片硬件性能的不足,,提供了更多軟件算法的創(chuàng)新空間。
DeepSeek的成功也影響了國內(nèi)的大模型創(chuàng)業(yè)公司,,如“六小虎”,。這些公司在技術(shù)創(chuàng)新、產(chǎn)品認(rèn)知和企業(yè)影響力方面面臨巨大壓力,。一些公司甚至調(diào)整了項(xiàng)目的優(yōu)先級(jí),,以應(yīng)對(duì)DeepSeek的競爭。
許多公司開始接入DeepSeek模型,,包括云廠商,、芯片廠商和其他大模型同行。騰訊元寶也在自有混元大模型的情況下接入了DeepSeek R1,。AI產(chǎn)業(yè)鏈的東風(fēng)已至,,更多的下游應(yīng)用公司也將搭上這股東風(fēng),例如教育公司,、證券行業(yè)和手機(jī)廠商,。
DeepSeek的成功啟示了更多公司,尤其是在算法架構(gòu)和工程上的創(chuàng)新,。未來,,更多公司將利用開源大模型以低成本服務(wù)市場,催生大量獨(dú)立小廠的機(jī)會(huì),。完全自動(dòng)化而非co-pilot模式的應(yīng)用場景潛力更加突出,。市場已經(jīng)傳出DeepSeek正在以80億美元估值融資的消息,投資者將目光轉(zhuǎn)向AI產(chǎn)業(yè)鏈的其他變革機(jī)會(huì),。
近日,又有近10家券商宣布完成了DeepSeek-R1的本地化部署,。DeepSeek-R1是該系列模型的最新版本,。目前,,至少有16家券商在探索DeepSeek模型的應(yīng)用
2025-02-10 10:50:23持續(xù)擴(kuò)容