DeepSeek撼動(dòng)AI生態(tài)游戲規(guī)則!今年春節(jié),,一款名為DeepSeek R1的中國(guó)大模型在全球AI圈引起了廣泛關(guān)注,。這款模型直接對(duì)標(biāo)了OpenAI去年9月發(fā)布的OpenAI o1系列模型。1月27日,,DeepSeek在中國(guó)區(qū)和美國(guó)區(qū)蘋(píng)果App Store免費(fèi)榜上同時(shí)沖到了下載量第一,,單周下載量高達(dá)約240萬(wàn)次。
在DeepSeek R1發(fā)布之前,,OpenAI o1一直是中國(guó)大模型廠商難以企及的目標(biāo),。然而,DeepSeek R1的出現(xiàn)改變了這一局面,。OpenAI CEO奧特曼表示,,這是一個(gè)令人印象深刻的模型,英偉達(dá)也稱贊其為最先進(jìn)的大語(yǔ)言模型,。與OpenAI的閉源策略不同,,DeepSeek R1不僅開(kāi)源,還免費(fèi)供全球用戶無(wú)限調(diào)用,。
這場(chǎng)由DeepSeek引發(fā)的AI風(fēng)暴,,也引起了一些恐慌和攻擊,。Meta內(nèi)部員工透露,生成式人工智能部門(mén)陷入恐慌,;OpenAI則在兩周內(nèi)接連發(fā)布了三個(gè)大模型:兩個(gè)AI智能體Operator,、Deep Research以及推理模型o3-mini。此外,1月28日凌晨,,DeepSeek官網(wǎng)連續(xù)發(fā)布公告稱,,線上服務(wù)受到大規(guī)模惡意攻擊。
值得注意的是,,DeepSeek打破了大模型行業(yè)拼算力的共識(shí),,僅用了不到OpenAI十分之一的資源就做出了性能對(duì)標(biāo)OpenAI o1的DeepSeek R1。這引發(fā)了人們對(duì)AI上下游產(chǎn)業(yè)的重新思考,。截至1月27日美股收盤(pán),,美股科技股大跌,費(fèi)城半導(dǎo)體指數(shù)下跌9.2%,,英偉達(dá)股價(jià)下跌近17%。
2023年春節(jié),,ChatGPT的出現(xiàn)點(diǎn)燃了AI行業(yè)的火種,。自那之后,,每年春節(jié)都有爆火的大模型出現(xiàn)。2024年是Sora,,2025年則是DeepSeek。今年,,站在C位的是中國(guó)的深度求索。DeepSeek上線20天,,日活突破2000萬(wàn),,徹底沖擊了AI行業(yè)。
實(shí)際上,,相比OpenAI和其他公司動(dòng)輒數(shù)億美元的訓(xùn)練成本,,DeepSeek始終走的是“花小錢(qián),辦大事”的路線,。早在去年12月底,,DeepSeek發(fā)布的V3模型僅使用2048塊英偉達(dá)H800芯片,耗費(fèi)約560萬(wàn)美元,。相比之下,,GPT-4o使用上萬(wàn)塊英偉達(dá)H100芯片,訓(xùn)練成本約1億美元,。
無(wú)論是價(jià)格還是訓(xùn)練成本,,DeepSeek都追求細(xì)分和創(chuàng)新,。例如,通過(guò)一種新的MLA架構(gòu)和數(shù)據(jù)蒸餾技術(shù),,降低了顯存占用并減少了訓(xùn)練數(shù)據(jù)量,。DeepSeek R1的強(qiáng)大推理能力得益于強(qiáng)化學(xué)習(xí)方法,無(wú)需任何監(jiān)督式微調(diào),。
DeepSeek的成功不僅在于技術(shù)創(chuàng)新,,還在于其開(kāi)源理念。DeepSeek R1的預(yù)訓(xùn)練成本僅為557.6萬(wàn)美元,,遠(yuǎn)低于GPT-4o的水平,。此外,DeepSeek API服務(wù)定價(jià)也遠(yuǎn)低于OpenAI,。這些變化讓市場(chǎng)開(kāi)始質(zhì)疑,,是否真的需要那么多算力來(lái)訓(xùn)練高性能的大模型。
DeepSeek的崛起打破了原有的平衡,,對(duì)傳統(tǒng)AI巨頭構(gòu)成了挑戰(zhàn)。OpenAI迅速做出調(diào)整,,發(fā)布了o3-mini等新模型,,并降低了API調(diào)用價(jià)格。與此同時(shí),,DeepSeek也面臨一些爭(zhēng)議,,包括被指控未經(jīng)授權(quán)竊取數(shù)據(jù)以及遭受網(wǎng)絡(luò)攻擊。不過(guò),,許多企業(yè)如華為云,、騰訊云、阿里云等紛紛宣布支持DeepSeek大模型,。
這場(chǎng)由DeepSeek掀起的新風(fēng)暴仍在繼續(xù),,未來(lái)AI行業(yè)的走向充滿變數(shù)。
在DeepSeek極低成本的推動(dòng)下,,開(kāi)源模型和閉源模型之間的差距顯著縮小,,掀起了一輪國(guó)產(chǎn)AI芯片廠商競(jìng)相適配的風(fēng)潮
2025-02-15 18:37:10DeepSeek訓(xùn)練仍基于英偉達(dá)CUDA生態(tài)