2025年1月中旬,英偉達(dá)CEO黃仁勛訪問中國,,從北京到深圳,,再到臺(tái)中和上海,引起廣泛關(guān)注。然而,在距離英偉達(dá)上海辦公室僅200公里的杭州,一家名為深度求索(DeepSeek)的中國公司正在悄然醞釀一場足以撼動(dòng)AI產(chǎn)業(yè)格局的風(fēng)暴,。1月20日,DeepSeek開源了推理模型DeepSeek-R1,,這一事件迅速引起了全球關(guān)注,,導(dǎo)致英偉達(dá)市值一周內(nèi)蒸發(fā)了5520億美元。
DeepSeek的崛起主要得益于其在性能,、價(jià)格和開源方面的三重沖擊,。1月24日發(fā)布的聊天機(jī)器人競技場榜單上,DeepSeek-R1綜合排名第三,,與OpenAI的ChatGPT并列,,并在高難度提示詞、代碼和數(shù)學(xué)等領(lǐng)域位列第一,。DeepSeek-R1的價(jià)格低得驚人,,僅為競爭對(duì)手的2%~3%,且完全免費(fèi)提供移動(dòng)應(yīng)用和網(wǎng)頁端服務(wù),。此外,,DeepSeek-R1完全開源,,任何人都可以自由使用,、修改、分發(fā)和商業(yè)化該模型,。
著名投資公司A16z的創(chuàng)始人馬克·安德森認(rèn)為,,Deepseek-R1是令人驚嘆的突破之一,而且還是開源的,,堪稱給世界的一份禮物,。Scale AI創(chuàng)始人亞歷山大·王表示,DeepSeek的發(fā)布可能會(huì)改變中美在AI競賽中的局勢,。
華爾街對(duì)此感到焦慮,,投資者開始質(zhì)疑巨頭們?cè)谒懔ι系耐度胧欠裰档谩M缎蠮effreies股票分析師Edison Lee團(tuán)隊(duì)指出,,美國AI企業(yè)的管理層可能面臨更大的壓力,,需要回答進(jìn)一步提高AI資本支出是否合理的問題。摩根大通分析師Joshua Meyers則認(rèn)為,,DeepSeek的低成本并不意味著擴(kuò)張的終結(jié),,也不意味著不再需要更多的算力。
DeepSeek的成功部分歸功于數(shù)據(jù)蒸餾技術(shù),,但這一技術(shù)在行業(yè)內(nèi)存在爭議,。南洋理工大學(xué)研究人員王漢卿表示,被訓(xùn)練的模型無法真正超越“教師模型”。不過,,DeepSeek-V3的創(chuàng)新不僅于此,,其精簡有效的架構(gòu)和自主提出的MLA機(jī)制也降低了緩存使用。
DeepSeek選擇了一條與OpenAI截然不同的技術(shù)路線,,完全摒棄了傳統(tǒng)的監(jiān)督微調(diào)環(huán)節(jié),,依賴強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練。DeepSeek創(chuàng)始人梁文鋒強(qiáng)調(diào)原創(chuàng)的重要性,,他認(rèn)為只有通過原創(chuàng)才能擺脫追隨者的地位,。OpenAI首席執(zhí)行官山姆·阿爾特曼承認(rèn)DeepSeek是一個(gè)非常好的模型,并表示將推出更好的模型,。
科技巨頭如微軟,、AWS和英偉達(dá)紛紛接入DeepSeek-R1模型服務(wù)。微軟將其添加到Azure AI Foundry,,AWS也在其平臺(tái)上部署了DeepSeek-R1,。英偉達(dá)宣布DeepSeek-R1作為NVIDIA NIM微服務(wù)預(yù)覽版發(fā)布。AMD也宣布DeepSeek-V3模型已集成至AMD Instinct GPU上,。
DeepSeek的出現(xiàn)引發(fā)了對(duì)AI未來發(fā)展的討論,。吳恩達(dá)提醒,擴(kuò)大規(guī)模并非實(shí)現(xiàn)AI進(jìn)步的唯一途徑,,算法創(chuàng)新同樣重要,。隨著訓(xùn)練成本降低和技術(shù)成熟,大語言模型將愈發(fā)成為一種普通產(chǎn)品,。Hugging Face聯(lián)合創(chuàng)始人托馬斯?沃爾夫認(rèn)為,,許多這類模型將會(huì)免費(fèi)且可自由獲取。巧合的是,,同日,,OpenAI推出了全新推理模型o3-mini,并首次向免費(fèi)用戶開放,。Sam Altman罕見承認(rèn)OpenAI過去在開源方面站在“歷史錯(cuò)誤的一邊”,,并表示需要想出一個(gè)不同的開源策略。
過去一周,,中國的人工智能大模型成為硅谷乃至全球科技界的熱議話題,。引發(fā)這場討論的是中國人工智能初創(chuàng)公司深度求索(DeepSeek)
2025-01-27 10:02:46幻方DeepSeek如何震驚硅谷數(shù)據(jù)是寶貴的資源,能夠幫助投資者減少煩惱,。中國AI大模型市場正快速發(fā)展,。近日,量化巨頭幻方量化旗下公司DeepSeek發(fā)布了推理大模型DeepSeek-R1
2025-01-27 09:33:36DeepSeek出圈概念股曝光