然而,,大模型“六小虎”面臨的行業(yè)質(zhì)疑再度抬頭,。一年前,,這些初創(chuàng)企業(yè)還被資本選中要跟OpenAI打擂臺,,但現(xiàn)在他們在影響力,、技術(shù)認(rèn)可度和用戶規(guī)模等方面全面落后。
DeepSeek的影響廣泛,,既是對手的威脅,,也是行業(yè)的東風(fēng)。它已成為2025年的絕對主角,。
在今年的達(dá)沃斯論壇上,,許多人向Fusion Fund創(chuàng)始合伙人張璐打聽起DeepSeek。這家公司成立于2023年,,脫胎于知名量化基金幻方量化,,目前未進(jìn)行任何外部融資。創(chuàng)始人梁文鋒自去年年中起,,憑借DeepSeek-V2在MLA等方面的創(chuàng)新得到了業(yè)內(nèi)認(rèn)可,,被視為一股“來自東方的神秘力量”。
DeepSeek最近發(fā)布的V3和R1成為轉(zhuǎn)折點(diǎn),。特別是R1完全復(fù)現(xiàn)了OpenAI o1推理模型能力,,并且完全免費(fèi)。DeepSeek的創(chuàng)新包括模型壓縮,、多頭潛在注意力機(jī)制,、混合專家模型和FP8混合精度訓(xùn)練等技術(shù)。硅谷的華人工程師們對此表示佩服,。
DeepSeek掀起的“AI降本浪潮”使得大家都能以更低的成本開發(fā)大模型,。據(jù)官方論文介紹,DeepSeek訓(xùn)練V3模型的成本約為557.6萬美元,,而Llama-3.1的訓(xùn)練成本高達(dá)數(shù)億美元,。華爾街再次對AI算力泡沫心生恐慌,擔(dān)心未來DeepSeek的低成本模式一旦推廣,科技公司是否還需要大量購入英偉達(dá)先進(jìn)的AI芯片支持模型開發(fā),?
盡管如此,,英偉達(dá)強(qiáng)調(diào)DeepSeek的進(jìn)步不僅不意味著算力過剩,反而證明市場需要更多AI芯片,。事實(shí)上,,微軟、亞馬遜,、Meta,、谷歌等巨頭都大幅增加了2025年的資本開支,重點(diǎn)投資數(shù)據(jù)中心等AI基建項(xiàng)目,。
此外,,DeepSeek的創(chuàng)新對國產(chǎn)算力芯片也是一大利好。比如FP8混合精度算力訓(xùn)練方法在一定程度上彌補(bǔ)了國內(nèi)芯片硬件性能的不足,,提供了更多軟件算法的創(chuàng)新空間,。
DeepSeek的成功也影響了國內(nèi)的大模型創(chuàng)業(yè)公司,如“六小虎”,。這些公司在技術(shù)創(chuàng)新,、產(chǎn)品認(rèn)知和企業(yè)影響力方面面臨巨大壓力。一些公司甚至調(diào)整了項(xiàng)目的優(yōu)先級,,以應(yīng)對DeepSeek的競爭,。
許多公司開始接入DeepSeek模型,包括云廠商,、芯片廠商和其他大模型同行,。騰訊元寶也在自有混元大模型的情況下接入了DeepSeek R1。AI產(chǎn)業(yè)鏈的東風(fēng)已至,,更多的下游應(yīng)用公司也將搭上這股東風(fēng),,例如教育公司、證券行業(yè)和手機(jī)廠商,。
DeepSeek的成功啟示了更多公司,,尤其是在算法架構(gòu)和工程上的創(chuàng)新。未來,,更多公司將利用開源大模型以低成本服務(wù)市場,,催生大量獨(dú)立小廠的機(jī)會。完全自動化而非co-pilot模式的應(yīng)用場景潛力更加突出,。市場已經(jīng)傳出DeepSeek正在以80億美元估值融資的消息,,投資者將目光轉(zhuǎn)向AI產(chǎn)業(yè)鏈的其他變革機(jī)會。
近日,又有近10家券商宣布完成了DeepSeek-R1的本地化部署,。DeepSeek-R1是該系列模型的最新版本,。目前,至少有16家券商在探索DeepSeek模型的應(yīng)用
2025-02-10 10:50:23持續(xù)擴(kuò)容