2025年1月中旬,,英偉達(dá)CEO黃仁勛訪問(wèn)中國(guó),,從北京到深圳,,再到臺(tái)中和上海,,引起廣泛關(guān)注,。然而,,在距離英偉達(dá)上海辦公室僅200公里的杭州,,一家名為深度求索(DeepSeek)的中國(guó)公司正在悄然醞釀一場(chǎng)足以撼動(dòng)AI產(chǎn)業(yè)格局的風(fēng)暴,。1月20日,,DeepSeek開(kāi)源了推理模型DeepSeek-R1,,這一事件迅速引起了全球關(guān)注,導(dǎo)致英偉達(dá)市值一周內(nèi)蒸發(fā)了5520億美元,。
DeepSeek的崛起主要得益于其在性能,、價(jià)格和開(kāi)源方面的三重沖擊。1月24日發(fā)布的聊天機(jī)器人競(jìng)技場(chǎng)榜單上,,DeepSeek-R1綜合排名第三,,與OpenAI的ChatGPT并列,并在高難度提示詞、代碼和數(shù)學(xué)等領(lǐng)域位列第一,。DeepSeek-R1的價(jià)格低得驚人,,僅為競(jìng)爭(zhēng)對(duì)手的2%~3%,且完全免費(fèi)提供移動(dòng)應(yīng)用和網(wǎng)頁(yè)端服務(wù),。此外,,DeepSeek-R1完全開(kāi)源,任何人都可以自由使用,、修改,、分發(fā)和商業(yè)化該模型。
著名投資公司A16z的創(chuàng)始人馬克·安德森認(rèn)為,,Deepseek-R1是令人驚嘆的突破之一,,而且還是開(kāi)源的,堪稱給世界的一份禮物,。Scale AI創(chuàng)始人亞歷山大·王表示,,DeepSeek的發(fā)布可能會(huì)改變中美在AI競(jìng)賽中的局勢(shì)。
華爾街對(duì)此感到焦慮,,投資者開(kāi)始質(zhì)疑巨頭們?cè)谒懔ι系耐度胧欠裰档?。投行Jeffreies股票分析師Edison Lee團(tuán)隊(duì)指出,美國(guó)AI企業(yè)的管理層可能面臨更大的壓力,,需要回答進(jìn)一步提高AI資本支出是否合理的問(wèn)題,。摩根大通分析師Joshua Meyers則認(rèn)為,DeepSeek的低成本并不意味著擴(kuò)張的終結(jié),,也不意味著不再需要更多的算力,。
DeepSeek的成功部分歸功于數(shù)據(jù)蒸餾技術(shù),但這一技術(shù)在行業(yè)內(nèi)存在爭(zhēng)議,。南洋理工大學(xué)研究人員王漢卿表示,,被訓(xùn)練的模型無(wú)法真正超越“教師模型”。不過(guò),,DeepSeek-V3的創(chuàng)新不僅于此,,其精簡(jiǎn)有效的架構(gòu)和自主提出的MLA機(jī)制也降低了緩存使用。
過(guò)去一周,,中國(guó)的人工智能大模型成為硅谷乃至全球科技界的熱議話題。引發(fā)這場(chǎng)討論的是中國(guó)人工智能初創(chuàng)公司深度求索(DeepSeek)
2025-01-27 10:02:46幻方DeepSeek如何震驚硅谷