DeepSeek以低成本和少量芯片實(shí)現(xiàn)了與OpenAI等巨頭媲美的性能,,引發(fā)國(guó)際AI界的廣泛關(guān)注,。這意味著如果算力不再是決定AI性能的關(guān)鍵因素,,之前大量投資英偉達(dá)芯片的邏輯可能會(huì)發(fā)生變化,其他相關(guān)行業(yè)也將受到影響,。一位首席經(jīng)濟(jì)學(xué)家在微博上表達(dá)了這一觀點(diǎn),。
緊接著,,周一亞洲市場(chǎng)率先感受到了“東方神秘力量”DeepSeek帶來的沖擊,。A股中的DeepSeek概念暴漲超過11%,而算力相關(guān)的板塊如AI算力、GPU,、液冷服務(wù)器和ASIC芯片等均大跌超3%,。光芯片、高速銅互聯(lián),、光通信和光模塊等板塊跌幅更是達(dá)到5%以上,。日本半導(dǎo)體ETF也下跌了超過3%。
實(shí)際上,,DeepSeek帶來的焦慮甚至恐慌更多地體現(xiàn)在美國(guó)市場(chǎng),。周一納斯達(dá)克期貨跌近3%,計(jì)劃為美國(guó)AI投資千億美元的軟銀股價(jià)暴跌6%,。市場(chǎng)擔(dān)心的問題不僅是中國(guó)AI技術(shù)追趕甚至超越美國(guó),,還包括對(duì)DeepSeek高效訓(xùn)練方法的驚愕。這引發(fā)了關(guān)于美國(guó)科技巨頭囤積GPU的意義,、英偉達(dá)市值的真實(shí)價(jià)值以及美國(guó)政府管制先進(jìn)AI芯片出口效果的質(zhì)疑,。
令人驚訝的是,在中國(guó)獲取先進(jìn)AI芯片受到嚴(yán)格限制的情況下,,一家成立僅一年半且去年才推出首款大模型的年輕公司能夠給全球市場(chǎng)帶來如此震撼,。該公司沒有迷信傳統(tǒng)的“大力出奇跡”的尺度定律,而是專注于創(chuàng)新訓(xùn)練方法,,減少了對(duì)計(jì)算資源的需求,。
去年12月,DeepSeek發(fā)布了新一代開源大模型DeepSeek-v3,,其能力接近閉源的GPT-4,但訓(xùn)練成本僅為557.6萬美元,,使用了2048張英偉達(dá)H800 AI芯片,。相比之下,類似能力的模型通常需要1.6萬張GPU進(jìn)行集群訓(xùn)練,,例如Meta發(fā)布的Llama-3-405B在類似的集群上花費(fèi)了3080萬GPU小時(shí),,而DeepSeek僅用了約280萬GPU小時(shí)。
這種高效的訓(xùn)練方式改變了AI對(duì)先進(jìn)芯片和算力需求的邏輯,。行業(yè)分析認(rèn)為,,DeepSeek開源讓一些對(duì)OpenAI封閉不滿的研究者感到高興,更重要的是,,它展示了中國(guó)在先進(jìn)算力受限情況下研發(fā)先進(jìn)模型的能力,。