中國(guó)人工智能公司DeepSeek最近聲稱其新的人工智能模型性能優(yōu)于OpenAI,,但構(gòu)建成本僅為后者的一小部分,。這一聲明震驚了市場(chǎng),尤其是提到其大型語(yǔ)言模型的訓(xùn)練成本僅為560萬(wàn)美元,,引發(fā)了對(duì)科技巨頭在高級(jí)AI工作負(fù)載上巨額投入的關(guān)注,。由于投資者擔(dān)心DeepSeek的影響,英偉達(dá)的市值在周一蒸發(fā)近6000億美元,。
然而,,并非所有人都相信DeepSeek的說(shuō)法。上周,,DeepSeek發(fā)布了新的推理模型R1,,宣稱可以與OpenAI的o1相媲美。這種模型旨在以類似人類的方式處理復(fù)雜問題,。DeepSeek由專注于人工智能的量化對(duì)沖基金High-Flyer聯(lián)合創(chuàng)始人梁文鋒于2023年創(chuàng)立,,專注于大型語(yǔ)言模型和實(shí)現(xiàn)通用人工智能(AGI)。
R1背后的技術(shù)并不新鮮,,但值得注意的是,,DeepSeek是首個(gè)將其部署到高性能AI模型中的公司。據(jù)稱,,其功耗要求大大降低,。歐亞集團(tuán)地緣技術(shù)業(yè)務(wù)總監(jiān)陸曉萌認(rèn)為,這表明發(fā)展這一行業(yè)的可能性很大,,而高端芯片/資本密集型方式只是其中一種技術(shù)路徑,。
DeepSeek有兩個(gè)主要系統(tǒng):V3和R1,都是開源的,,意味著底層代碼免費(fèi)且公開。V3共有6710億個(gè)參數(shù),,相比之下,,專家估計(jì)OpenAI最新模型至少有1萬(wàn)億個(gè)參數(shù)。DeepSeek表示,,R1在多個(gè)基準(zhǔn)測(cè)試中實(shí)現(xiàn)了與o1相當(dāng)?shù)男阅?。此外,V3的訓(xùn)練成本僅為560萬(wàn)美元,,遠(yuǎn)低于西方競(jìng)爭(zhēng)對(duì)手,。
不過(guò),這些說(shuō)法也受到了質(zhì)疑,。The Futurum Group首席執(zhí)行官丹尼爾·紐曼表示,,雖然這是一個(gè)巨大突破,,但他對(duì)具體數(shù)字持懷疑態(tài)度。DGA Group中國(guó)區(qū)高級(jí)副總裁Paul Triolio指出,,很難直接比較DeepSeek的成本和美國(guó)主要開發(fā)商的成本,,因?yàn)?60萬(wàn)美元僅是一次訓(xùn)練運(yùn)行的成本,總體研發(fā)成本可能更高,。
DeepSeek和OpenAI都在網(wǎng)站上披露了模型計(jì)算的定價(jià),。DeepSeek每100萬(wàn)個(gè)輸入標(biāo)記的成本為55美分,輸出標(biāo)記為2.19美元,;而OpenAI的o1則分別為15美元和60美元,。對(duì)于GPT-4o mini,OpenAI每100萬(wàn)個(gè)輸入令牌收取15美分,。