DeepSeek婉拒所有采訪專注研發(fā)。DeepSeek的最新動作迫使OpenAI在深夜緊急上線o3-mini,。近半個月來,,中國的人工智能技術(shù)持續(xù)占據(jù)國內(nèi)外媒體頭條,影響力不斷擴大,。關(guān)于DeepSeek模型的訓(xùn)練數(shù)據(jù),、GPU使用量、團隊構(gòu)成及強化學習算法等細節(jié)成為關(guān)注焦點,。
SemiAnalysis的一篇深度報道從多個角度進行了推測,,包括訓(xùn)練成本、對閉源模型利潤的影響以及團隊規(guī)模等,。報道指出,,DeepSeek并非簡單的副業(yè)項目,其在GPU等硬件上的支出超過5億美元,。論文中提到的600萬美元僅是預(yù)訓(xùn)練階段的GPU成本,,研發(fā)和硬件總擁有成本并未計算在內(nèi)。DeepSeek擁有約5萬塊Hopper GPU,,包括特供版H800和H20,。公司大約有150名員工,并定期從北大,、浙大等頂尖高校招募人才,,優(yōu)秀候選人年薪可達130萬美元。
DeepSeek的一個關(guān)鍵創(chuàng)新是多頭潛注意力機制(MLA),,該機制顯著降低了推理成本,。此外,V3模型性能遠超R1和o1,,谷歌的Gemini 2.0 Flash Thinking與R1不相上下,。隨著V3和R1的發(fā)布,H100價格大幅上漲,,這體現(xiàn)了杰文斯悖論的作用,。
幻方量化作為DeepSeek的主要投資者,很早就看到了AI在金融領(lǐng)域之外的巨大潛力,。他們在2021年購入了10,000塊A100 GPU,,這一決策后來被證明極具前瞻性,。2023年5月,幻方?jīng)Q定分拆成立DeepSeek,,以更專注地推進AI技術(shù)發(fā)展,。目前兩家公司在人力資源和計算資源方面保持密切合作。
OpenAI CEO 山姆·阿爾特曼于2月3日在東京對媒體表示,,公司沒有起訴DeepSeek的計劃,。他強調(diào)公司將繼續(xù)打造出色的產(chǎn)品,并以模型能力引領(lǐng)世界
2025-02-05 09:22:44沒起訴DeepSeek的打算1月30日,有消息稱面臨美科技霸凌,,DeepSeek向360及所有中國科技公司發(fā)出倡議,,攜手強化技術(shù)合作。相關(guān)人土對新浪科技稱,,此倡議書為假
2025-02-01 09:03:53系假消息