DeepSeek以低成本和少量芯片實(shí)現(xiàn)了與OpenAI等巨頭媲美的性能,,引發(fā)國際AI界的廣泛關(guān)注,。這意味著如果算力不再是決定AI性能的關(guān)鍵因素,之前大量投資英偉達(dá)芯片的邏輯可能會發(fā)生變化,,其他相關(guān)行業(yè)也將受到影響,。一位首席經(jīng)濟(jì)學(xué)家在微博上表達(dá)了這一觀點(diǎn)。
緊接著,,周一亞洲市場率先感受到了“東方神秘力量”DeepSeek帶來的沖擊,。A股中的DeepSeek概念暴漲超過11%,而算力相關(guān)的板塊如AI算力,、GPU,、液冷服務(wù)器和ASIC芯片等均大跌超3%。光芯片、高速銅互聯(lián),、光通信和光模塊等板塊跌幅更是達(dá)到5%以上,。日本半導(dǎo)體ETF也下跌了超過3%。
實(shí)際上,,DeepSeek帶來的焦慮甚至恐慌更多地體現(xiàn)在美國市場,。周一納斯達(dá)克期貨跌近3%,計劃為美國AI投資千億美元的軟銀股價暴跌6%,。市場擔(dān)心的問題不僅是中國AI技術(shù)追趕甚至超越美國,,還包括對DeepSeek高效訓(xùn)練方法的驚愕。這引發(fā)了關(guān)于美國科技巨頭囤積GPU的意義,、英偉達(dá)市值的真實(shí)價值以及美國政府管制先進(jìn)AI芯片出口效果的質(zhì)疑。
令人驚訝的是,,在中國獲取先進(jìn)AI芯片受到嚴(yán)格限制的情況下,,一家成立僅一年半且去年才推出首款大模型的年輕公司能夠給全球市場帶來如此震撼。該公司沒有迷信傳統(tǒng)的“大力出奇跡”的尺度定律,,而是專注于創(chuàng)新訓(xùn)練方法,,減少了對計算資源的需求。
去年12月,,DeepSeek發(fā)布了新一代開源大模型DeepSeek-v3,,其能力接近閉源的GPT-4,但訓(xùn)練成本僅為557.6萬美元,,使用了2048張英偉達(dá)H800 AI芯片,。相比之下,類似能力的模型通常需要1.6萬張GPU進(jìn)行集群訓(xùn)練,,例如Meta發(fā)布的Llama-3-405B在類似的集群上花費(fèi)了3080萬GPU小時,,而DeepSeek僅用了約280萬GPU小時。
短短一個月內(nèi),中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:21:32DeepSeek大模型強(qiáng)在哪過去一周,中國的人工智能大模型成為硅谷乃至全球科技界的熱議話題,。引發(fā)這場討論的是中國人工智能初創(chuàng)公司深度求索(DeepSeek)
2025-01-27 10:02:46幻方DeepSeek如何震驚硅谷數(shù)據(jù)是寶貴的資源,,能夠幫助投資者減少煩惱。中國AI大模型市場正快速發(fā)展,。近日,,量化巨頭幻方量化旗下公司DeepSeek發(fā)布了推理大模型DeepSeek-R1
2025-01-27 09:33:36DeepSeek出圈概念股曝光