上周,,中國(guó)DeepSeek的AI工程師團(tuán)隊(duì)推出的DeepSeek R1大模型在美國(guó)熱搜上引起轟動(dòng),并在蘋(píng)果中國(guó)和美國(guó)地區(qū)的應(yīng)用商店免費(fèi)APP下載排行榜上登頂,,超越了ChatGPT,。這標(biāo)志著中國(guó)AI的一個(gè)重要時(shí)刻。DeepSeek團(tuán)隊(duì)展示了他們能在沒(méi)有頂級(jí)英偉達(dá)高性能AI GPU的情況下,以較低成本和性能普通的AI加速器訓(xùn)練出一流的開(kāi)源AI大模型,,這意味著未來(lái)的AI模型訓(xùn)練和推理可能不再依賴于昂貴的算力,。
DeepSeek R1的發(fā)布表明,AI訓(xùn)練與推理的成本大幅降低,。該模型在不到600萬(wàn)美元的投資和2048塊H800芯片的支持下,,達(dá)到了與OpenAI o1相當(dāng)?shù)男阅埽笳咝枰哌_(dá)10億美元的訓(xùn)練成本,。DeepSeek R1每百萬(wàn)個(gè)token的查詢成本僅為0.14美元,,相比之下,OpenAI的成本為7.50美元,。這一成就預(yù)示著低成本的新范式正在形成,,AI ASIC的時(shí)代即將到來(lái)。
UC伯克利,、港科大和HuggingFace等學(xué)術(shù)機(jī)構(gòu)成功復(fù)現(xiàn)了DeepSeek模型,,僅用強(qiáng)化學(xué)習(xí)而無(wú)需監(jiān)督微調(diào),就能見(jiàn)證AI模型的“頓悟時(shí)刻”,。這種低成本和高效的方法引發(fā)了全球AI領(lǐng)域的關(guān)注,。圖靈獎(jiǎng)得主Yann Lecun也表示,這是開(kāi)源對(duì)閉源AI大模型的一次勝利,。DeepSeek的應(yīng)用一度因訪問(wèn)量激增而短暫崩潰,,但問(wèn)題很快得到解決。
DeepSeek R1的成功展示了通過(guò)極致工程化和集中精度的技術(shù)趨勢(shì),,使得AI ASIC在AI訓(xùn)練端更具競(jìng)爭(zhēng)力,。在推理端,隨著生成式AI軟件和AI代理的大規(guī)模普及,,推理需求將顯著增加,。DeepSeek開(kāi)創(chuàng)的低成本范式使得AI ASIC在性能和成本上都優(yōu)于傳統(tǒng)的AI GPU。
DeepSeek R1的推出讓全球科技股投資者對(duì)英偉達(dá)高性能AI GPU的必要性產(chǎn)生了懷疑,。許多科技巨頭開(kāi)始考慮自研AI ASIC,,以提高性價(jià)比。盡管英偉達(dá)計(jì)劃進(jìn)軍AI ASIC領(lǐng)域,,但目前尚未有具體布局,,難以撼動(dòng)博通和Marvell的主導(dǎo)地位。
DeepSeek通過(guò)高效的訓(xùn)練方法和數(shù)據(jù)壓縮策略,,大幅降低了訓(xùn)練和推理成本,。例如,多層注意力機(jī)制,、FP8混合精度訓(xùn)練,、DualPipe并行通信等技術(shù),,使得DeepSeek在有限資源下達(dá)到甚至超過(guò)行業(yè)主流大模型的性能。這種方法挑戰(zhàn)了傳統(tǒng)的巨額投入模式,,顯示出硬件和算法潛力的最大化利用,。
DeepSeek大模型在多個(gè)性能指標(biāo)上表現(xiàn)出色,尤其是在數(shù)學(xué)和編程方面,。其在2024年AIME測(cè)試中取得了優(yōu)異成績(jī),,接近OpenAI o1的水平。此外,,在評(píng)估實(shí)際軟件工程問(wèn)題解決能力的SWE-Bench Verified測(cè)試中,,DeepSeek的表現(xiàn)甚至優(yōu)于o1。
隨著AI訓(xùn)練和推理成本的降低,,AI ASIC有望逐漸占據(jù)市場(chǎng)份額,。博通和Marvell等公司正與大型云計(jì)算客戶合作開(kāi)發(fā)定制化的AI芯片,預(yù)計(jì)未來(lái)幾年內(nèi)將大規(guī)模部署,。摩根士丹利預(yù)測(cè),,AI ASIC市場(chǎng)規(guī)模將在2027年達(dá)到300億美元,年復(fù)合增長(zhǎng)率達(dá)到34%,。盡管如此,,AI ASIC和AI GPU將長(zhǎng)期共存,各自在特定領(lǐng)域發(fā)揮優(yōu)勢(shì),。