近年來(lái),,各大科技巨頭之間的大模型比拼都是算力戰(zhàn),,動(dòng)輒上百億美元的芯片資本支出,最頂級(jí)的芯片不僅供不應(yīng)求還限制出口,,這讓擁有雄厚財(cái)力的硅谷科技巨頭占盡優(yōu)勢(shì),。然而,DeepSeek以極低成本芯片訓(xùn)練出突破性模型,,讓這一切開(kāi)始動(dòng)搖,。據(jù)新智元報(bào)道,UC伯克利博士生潘家怡和另兩位研究人員在CountDown游戲中復(fù)現(xiàn)了DeepSeek R1-Zero,,通過(guò)強(qiáng)化學(xué)習(xí)RL,,3B的基礎(chǔ)語(yǔ)言模型也能夠自我驗(yàn)證和搜索,成本不到30美元,,結(jié)果相當(dāng)出色,。港科大助理教授何俊賢的團(tuán)隊(duì)僅用8K個(gè)樣本就在7B模型上復(fù)刻出了DeepSeek-R1-Zero和DeepSeek-R1的訓(xùn)練,模型在復(fù)雜的數(shù)學(xué)推理上取得了強(qiáng)勁結(jié)果,。全球最大開(kāi)源平臺(tái)HuggingFace團(tuán)隊(duì)也宣布復(fù)刻DeepSeek R1所有pipeline,,完成后所有訓(xùn)練數(shù)據(jù)和腳本將全部開(kāi)源。
展望未來(lái),,DeepSeek R1的問(wèn)世通過(guò)“極致壓縮+高效強(qiáng)化訓(xùn)練+AI推理算力大幅簡(jiǎn)化”的低成本新模式,,宣告屬于AI ASIC的時(shí)代已經(jīng)到來(lái)。ASIC憑借其算力,、能效和定制化優(yōu)勢(shì),,正成為AI基礎(chǔ)設(shè)施的“新基建”,推動(dòng)大模型,、自動(dòng)駕駛,、智能終端等領(lǐng)域的突破。未來(lái),,隨著Chiplet,、先進(jìn)封裝等技術(shù)的成熟,ASIC將進(jìn)一步降低成本,成為AI普惠化的核心引擎,。