DeepSeek撼動AI生態(tài)游戲規(guī)則,!今年春節(jié),,一款名為DeepSeek R1的中國大模型在全球AI圈引起了廣泛關(guān)注。這款模型直接對標(biāo)了OpenAI去年9月發(fā)布的OpenAI o1系列模型,。1月27日,,DeepSeek在中國區(qū)和美國區(qū)蘋果App Store免費榜上同時沖到了下載量第一,單周下載量高達約240萬次,。
在DeepSeek R1發(fā)布之前,,OpenAI o1一直是中國大模型廠商難以企及的目標(biāo)。然而,,DeepSeek R1的出現(xiàn)改變了這一局面,。OpenAI CEO奧特曼表示,這是一個令人印象深刻的模型,,英偉達也稱贊其為最先進的大語言模型,。與OpenAI的閉源策略不同,DeepSeek R1不僅開源,,還免費供全球用戶無限調(diào)用,。
這場由DeepSeek引發(fā)的AI風(fēng)暴,也引起了一些恐慌和攻擊,。Meta內(nèi)部員工透露,,生成式人工智能部門陷入恐慌;OpenAI則在兩周內(nèi)接連發(fā)布了三個大模型:兩個AI智能體Operator,、Deep Research以及推理模型o3-mini,。此外,1月28日凌晨,,DeepSeek官網(wǎng)連續(xù)發(fā)布公告稱,,線上服務(wù)受到大規(guī)模惡意攻擊,。
值得注意的是,,DeepSeek打破了大模型行業(yè)拼算力的共識,,僅用了不到OpenAI十分之一的資源就做出了性能對標(biāo)OpenAI o1的DeepSeek R1。這引發(fā)了人們對AI上下游產(chǎn)業(yè)的重新思考,。截至1月27日美股收盤,,美股科技股大跌,費城半導(dǎo)體指數(shù)下跌9.2%,,英偉達股價下跌近17%,。
2023年春節(jié),ChatGPT的出現(xiàn)點燃了AI行業(yè)的火種,。自那之后,,每年春節(jié)都有爆火的大模型出現(xiàn)。2024年是Sora,,2025年則是DeepSeek,。今年,站在C位的是中國的深度求索,。DeepSeek上線20天,,日活突破2000萬,徹底沖擊了AI行業(yè),。
實際上,,相比OpenAI和其他公司動輒數(shù)億美元的訓(xùn)練成本,DeepSeek始終走的是“花小錢,,辦大事”的路線,。早在去年12月底,DeepSeek發(fā)布的V3模型僅使用2048塊英偉達H800芯片,,耗費約560萬美元,。相比之下,GPT-4o使用上萬塊英偉達H100芯片,,訓(xùn)練成本約1億美元,。
無論是價格還是訓(xùn)練成本,DeepSeek都追求細分和創(chuàng)新,。例如,,通過一種新的MLA架構(gòu)和數(shù)據(jù)蒸餾技術(shù),降低了顯存占用并減少了訓(xùn)練數(shù)據(jù)量,。DeepSeek R1的強大推理能力得益于強化學(xué)習(xí)方法,,無需任何監(jiān)督式微調(diào)。
DeepSeek的成功不僅在于技術(shù)創(chuàng)新,,還在于其開源理念,。DeepSeek R1的預(yù)訓(xùn)練成本僅為557.6萬美元,遠低于GPT-4o的水平,。此外,,DeepSeek API服務(wù)定價也遠低于OpenAI,。這些變化讓市場開始質(zhì)疑,是否真的需要那么多算力來訓(xùn)練高性能的大模型,。
DeepSeek的崛起打破了原有的平衡,,對傳統(tǒng)AI巨頭構(gòu)成了挑戰(zhàn)。OpenAI迅速做出調(diào)整,,發(fā)布了o3-mini等新模型,,并降低了API調(diào)用價格。與此同時,,DeepSeek也面臨一些爭議,,包括被指控未經(jīng)授權(quán)竊取數(shù)據(jù)以及遭受網(wǎng)絡(luò)攻擊。不過,,許多企業(yè)如華為云,、騰訊云、阿里云等紛紛宣布支持DeepSeek大模型,。
這場由DeepSeek掀起的新風(fēng)暴仍在繼續(xù),,未來AI行業(yè)的走向充滿變數(shù)。
2月26日,在開源周第三天,,DeepSeek宣布開放高效的FP8 GEMM庫DeepGEMM,。這三天的發(fā)布內(nèi)容都與算法相關(guān),偏向技術(shù)層面
2025-02-26 21:35:35DeepSeek開源第三日行業(yè)影響幾何在DeepSeek極低成本的推動下,,開源模型和閉源模型之間的差距顯著縮小,掀起了一輪國產(chǎn)AI芯片廠商競相適配的風(fēng)潮
2025-02-15 18:37:10DeepSeek訓(xùn)練仍基于英偉達CUDA生態(tài)