DeepSeek撼動(dòng)AI生態(tài)游戲規(guī)則,!今年春節(jié),,一款名為DeepSeek R1的中國(guó)大模型在全球AI圈引起了廣泛關(guān)注。這款模型直接對(duì)標(biāo)了OpenAI去年9月發(fā)布的OpenAI o1系列模型。1月27日,,DeepSeek在中國(guó)區(qū)和美國(guó)區(qū)蘋果App Store免費(fèi)榜上同時(shí)沖到了下載量第一,單周下載量高達(dá)約240萬次,。
在DeepSeek R1發(fā)布之前,,OpenAI o1一直是中國(guó)大模型廠商難以企及的目標(biāo)。然而,,DeepSeek R1的出現(xiàn)改變了這一局面,。OpenAI CEO奧特曼表示,這是一個(gè)令人印象深刻的模型,,英偉達(dá)也稱贊其為最先進(jìn)的大語言模型,。與OpenAI的閉源策略不同,DeepSeek R1不僅開源,,還免費(fèi)供全球用戶無限調(diào)用,。
這場(chǎng)由DeepSeek引發(fā)的AI風(fēng)暴,也引起了一些恐慌和攻擊,。Meta內(nèi)部員工透露,,生成式人工智能部門陷入恐慌;OpenAI則在兩周內(nèi)接連發(fā)布了三個(gè)大模型:兩個(gè)AI智能體Operator,、Deep Research以及推理模型o3-mini,。此外,1月28日凌晨,,DeepSeek官網(wǎng)連續(xù)發(fā)布公告稱,,線上服務(wù)受到大規(guī)模惡意攻擊。
值得注意的是,,DeepSeek打破了大模型行業(yè)拼算力的共識(shí),,僅用了不到OpenAI十分之一的資源就做出了性能對(duì)標(biāo)OpenAI o1的DeepSeek R1,。這引發(fā)了人們對(duì)AI上下游產(chǎn)業(yè)的重新思考。截至1月27日美股收盤,,美股科技股大跌,,費(fèi)城半導(dǎo)體指數(shù)下跌9.2%,英偉達(dá)股價(jià)下跌近17%,。
2023年春節(jié),,ChatGPT的出現(xiàn)點(diǎn)燃了AI行業(yè)的火種。自那之后,,每年春節(jié)都有爆火的大模型出現(xiàn),。2024年是Sora,2025年則是DeepSeek,。今年,,站在C位的是中國(guó)的深度求索。DeepSeek上線20天,,日活突破2000萬,,徹底沖擊了AI行業(yè)。
實(shí)際上,,相比OpenAI和其他公司動(dòng)輒數(shù)億美元的訓(xùn)練成本,,DeepSeek始終走的是“花小錢,辦大事”的路線,。早在去年12月底,,DeepSeek發(fā)布的V3模型僅使用2048塊英偉達(dá)H800芯片,耗費(fèi)約560萬美元,。相比之下,,GPT-4o使用上萬塊英偉達(dá)H100芯片,訓(xùn)練成本約1億美元,。
無論是價(jià)格還是訓(xùn)練成本,,DeepSeek都追求細(xì)分和創(chuàng)新。例如,,通過一種新的MLA架構(gòu)和數(shù)據(jù)蒸餾技術(shù),,降低了顯存占用并減少了訓(xùn)練數(shù)據(jù)量。DeepSeek R1的強(qiáng)大推理能力得益于強(qiáng)化學(xué)習(xí)方法,,無需任何監(jiān)督式微調(diào),。
DeepSeek的成功不僅在于技術(shù)創(chuàng)新,還在于其開源理念,。DeepSeek R1的預(yù)訓(xùn)練成本僅為557.6萬美元,,遠(yuǎn)低于GPT-4o的水平,。此外,,DeepSeek API服務(wù)定價(jià)也遠(yuǎn)低于OpenAI。這些變化讓市場(chǎng)開始質(zhì)疑,,是否真的需要那么多算力來訓(xùn)練高性能的大模型,。
DeepSeek的崛起打破了原有的平衡,對(duì)傳統(tǒng)AI巨頭構(gòu)成了挑戰(zhàn),。OpenAI迅速做出調(diào)整,,發(fā)布了o3-mini等新模型,并降低了API調(diào)用價(jià)格,。與此同時(shí),,DeepSeek也面臨一些爭(zhēng)議,包括被指控未經(jīng)授權(quán)竊取數(shù)據(jù)以及遭受網(wǎng)絡(luò)攻擊,。不過,,許多企業(yè)如華為云、騰訊云,、阿里云等紛紛宣布支持DeepSeek大模型,。
這場(chǎng)由DeepSeek掀起的新風(fēng)暴仍在繼續(xù),未來AI行業(yè)的走向充滿變數(shù),。
2月26日,,在開源周第三天,,DeepSeek宣布開放高效的FP8 GEMM庫(kù)DeepGEMM。這三天的發(fā)布內(nèi)容都與算法相關(guān),,偏向技術(shù)層面
2025-02-26 21:35:35DeepSeek開源第三日行業(yè)影響幾何在DeepSeek極低成本的推動(dòng)下,開源模型和閉源模型之間的差距顯著縮小,,掀起了一輪國(guó)產(chǎn)AI芯片廠商競(jìng)相適配的風(fēng)潮
2025-02-15 18:37:10DeepSeek訓(xùn)練仍基于英偉達(dá)CUDA生態(tài)