然而,,中國AI大模型DeepSeek展示了不同的發(fā)展路徑,。DeepSeek由量化金融公司量化幻方的子公司深度求索開發(fā),,于2024年12月推出DeepSeek-V3,,并于近期公布DeepSeek-R1,。DeepSeek-V3的完整訓練僅需2.788M H800 GPU小時,成本為557萬美元,,性能媲美OpenAI的GPT-4o,。著名人工智能科學家卡帕西指出,這種級別的能力通常需要16000個GPU的集群,,而DeepSeek-V3僅使用了2048個GPU運行兩個月,,花費600萬美元。
DeepSeek-R1的訓練成本尚未公布,,但API定價顯示其每輸出一百萬Token的價格為2.19美元,,僅為GPT-o1的三十分之一。R1在數(shù)學,、編程等測試中的成績與o1相當,。這引發(fā)了一種質(zhì)疑:實現(xiàn)高性能AI大模型是否必須依賴大量算力和投資?通過軟件架構(gòu)及算法革新可能也是提高性能的有效途徑,。
韋豪創(chuàng)芯合伙人王智表示,,短期內(nèi)這起事件會利空AI算力,,但從長期來看,AI算力仍然必不可少,。AI大模型的發(fā)展需要更多新的架構(gòu)和算法支持,,盡管具體形式尚不清楚,但必然會有所突破,。
Deepseek對算力市場產(chǎn)生了顯著影響。假期期間,,它給AI算力帶來了巨大沖擊,,特別是在硬件廠商方面。美股和A股市場上與算力訓練相關的公司股價出現(xiàn)下跌
2025-02-11 08:24:36DeepSeek沒能讓算力焦慮消失1月27日,,英偉達美股盤前深度下跌超過12%,,跌破了2024年12月17日的126.86美元低點。黃仁勛可能沒想到,,撼動英偉達產(chǎn)業(yè)邏輯的是一家中國私募
2025-01-29 02:35:57從DeepSeek看算力需求的潛在邏輯本周,,中國互聯(lián)網(wǎng)上洋溢著喜悅的氣氛,。2017年,谷歌旗下“深層思維”公司戰(zhàn)勝中國頂尖圍棋選手,,展示了西方在人工智能領域的輝煌
2025-02-02 12:54:10一文看懂DeepSeek的中國式創(chuàng)新