DeepSeek撼動AI生態(tài)游戲規(guī)則,!今年春節(jié),一款名為DeepSeek R1的中國大模型在全球AI圈引起了廣泛關(guān)注,。這款模型直接對標了OpenAI去年9月發(fā)布的OpenAI o1系列模型,。1月27日,DeepSeek在中國區(qū)和美國區(qū)蘋果App Store免費榜上同時沖到了下載量第一,,單周下載量高達約240萬次,。
在DeepSeek R1發(fā)布之前,,OpenAI o1一直是中國大模型廠商難以企及的目標,。然而,,DeepSeek R1的出現(xiàn)改變了這一局面。OpenAI CEO奧特曼表示,,這是一個令人印象深刻的模型,,英偉達也稱贊其為最先進的大語言模型。與OpenAI的閉源策略不同,,DeepSeek R1不僅開源,,還免費供全球用戶無限調(diào)用。
這場由DeepSeek引發(fā)的AI風暴,,也引起了一些恐慌和攻擊,。Meta內(nèi)部員工透露,生成式人工智能部門陷入恐慌,;OpenAI則在兩周內(nèi)接連發(fā)布了三個大模型:兩個AI智能體Operator,、Deep Research以及推理模型o3-mini。此外,,1月28日凌晨,,DeepSeek官網(wǎng)連續(xù)發(fā)布公告稱,,線上服務受到大規(guī)模惡意攻擊,。
值得注意的是,DeepSeek打破了大模型行業(yè)拼算力的共識,,僅用了不到OpenAI十分之一的資源就做出了性能對標OpenAI o1的DeepSeek R1,。這引發(fā)了人們對AI上下游產(chǎn)業(yè)的重新思考。截至1月27日美股收盤,,美股科技股大跌,,費城半導體指數(shù)下跌9.2%,英偉達股價下跌近17%。
2023年春節(jié),,ChatGPT的出現(xiàn)點燃了AI行業(yè)的火種,。自那之后,每年春節(jié)都有爆火的大模型出現(xiàn),。2024年是Sora,,2025年則是DeepSeek。今年,,站在C位的是中國的深度求索,。DeepSeek上線20天,日活突破2000萬,,徹底沖擊了AI行業(yè),。
實際上,相比OpenAI和其他公司動輒數(shù)億美元的訓練成本,,DeepSeek始終走的是“花小錢,,辦大事”的路線。早在去年12月底,,DeepSeek發(fā)布的V3模型僅使用2048塊英偉達H800芯片,,耗費約560萬美元。相比之下,,GPT-4o使用上萬塊英偉達H100芯片,,訓練成本約1億美元。
無論是價格還是訓練成本,,DeepSeek都追求細分和創(chuàng)新,。例如,通過一種新的MLA架構(gòu)和數(shù)據(jù)蒸餾技術(shù),,降低了顯存占用并減少了訓練數(shù)據(jù)量,。DeepSeek R1的強大推理能力得益于強化學習方法,無需任何監(jiān)督式微調(diào),。
DeepSeek的成功不僅在于技術(shù)創(chuàng)新,,還在于其開源理念。DeepSeek R1的預訓練成本僅為557.6萬美元,,遠低于GPT-4o的水平,。此外,DeepSeek API服務定價也遠低于OpenAI,。這些變化讓市場開始質(zhì)疑,,是否真的需要那么多算力來訓練高性能的大模型。
DeepSeek的崛起打破了原有的平衡,,對傳統(tǒng)AI巨頭構(gòu)成了挑戰(zhàn),。OpenAI迅速做出調(diào)整,發(fā)布了o3-mini等新模型,并降低了API調(diào)用價格,。與此同時,,DeepSeek也面臨一些爭議,包括被指控未經(jīng)授權(quán)竊取數(shù)據(jù)以及遭受網(wǎng)絡攻擊,。不過,,許多企業(yè)如華為云、騰訊云,、阿里云等紛紛宣布支持DeepSeek大模型,。
這場由DeepSeek掀起的新風暴仍在繼續(xù),未來AI行業(yè)的走向充滿變數(shù),。
短短一個月內(nèi),,中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型——DeepSeek-V3和DeepSeek-R1
2025-01-26 10:34:01DeepSeek讓Meta深陷恐慌