過去一周,,中國的人工智能大模型成為硅谷乃至全球科技界的熱議話題。引發(fā)這場討論的是中國人工智能初創(chuàng)公司深度求索(DeepSeek),。該公司上周發(fā)布的推理大模型DeepSeek-R1因其性能可比肩OpenAI的o1,、極低的服務(wù)價格以及代碼和模型架構(gòu)的完全開源而震驚業(yè)界。
多位知名科技人士對DeepSeek近期取得的成就表示贊嘆,。Scale AI創(chuàng)始人亞歷山大·王稱,,美國可能在過去的十年里一直領(lǐng)先于中國,,但DeepSeek的發(fā)布可能會“改變一切”,。加州大學(xué)伯克利分校計算機科學(xué)教授伊恩·斯托伊卡表示,,DeepSeek-R1只需花費訓(xùn)練GPT、Gemini和Claude等現(xiàn)有大模型的一小部分成本即可獲得最先進(jìn)的結(jié)果,,并且在該校的大模型排行榜中排名第三,。
這一成就在美國對華芯片出口管制加強的背景下實現(xiàn)。斯托伊卡認(rèn)為,,限制條件和資源匱乏往往會激發(fā)創(chuàng)新,。
受到規(guī)模定律的影響,,全球AI大模型開發(fā)長期以來陷入了一場關(guān)于頂尖人才、先進(jìn)算力和巨額投資的競爭,。各大科技公司大量囤積芯片以確保充足的算力,。然而,當(dāng)越來越多科學(xué)家開始質(zhì)疑堆數(shù)據(jù)和堆算力的做法時,,中國量化交易公司幻方量化旗下的人工智能初創(chuàng)公司DeepSeek橫空出世,,通過優(yōu)化模型架構(gòu)和基礎(chǔ)設(shè)施等方式快速突進(jìn),。
早在去年12月,,該公司推出的DeepSeek-V3展現(xiàn)了極致性價比。從技術(shù)報告來看,,該模型僅需2.788M H800 GPU小時,,訓(xùn)練成本僅為557萬美元,但其性能與GPT-4o和Claude Sonnet 3.5等頂尖模型相當(dāng),。著名人工智能科學(xué)家卡帕西指出,,這種級別的能力通常需要接近16000顆GPU的集群。
最新發(fā)布的DeepSeek-R1在服務(wù)價格上也具有明顯優(yōu)勢,。其API服務(wù)定價為每百萬輸入tokens 1元(緩存命中)/ 4元(緩存未命中),,分別是OpenAI o1的2%和3.6%。外界普遍認(rèn)為,,美國尖端芯片出口管制并沒有削弱中國的AI能力,,反而推動了DeepSeek等初創(chuàng)公司以效率、資源池和協(xié)作的方式進(jìn)行創(chuàng)新,。
除了極致性價比,,DeepSeek的大模型還因代碼和訓(xùn)練方法的完全開源脫穎而出。目前,,DeepSeek-R1已成為開源社區(qū)Hugging Face上下載量最高的大模型,,下載量達(dá)10.9萬次。上海交通大學(xué)副教授劉鵬飛表示,,DeepSeek-V3和DeepSeek-R1的發(fā)布對高校研究者是一個利好,,因為公開的技術(shù)細(xì)節(jié)使整個過程更加透明,學(xué)術(shù)界的研究者可以進(jìn)入并發(fā)現(xiàn)技術(shù)棧中可以優(yōu)化的部分,。
DeepSeek創(chuàng)始人梁文鋒認(rèn)為,,開源更像一個文化行為,而非商業(yè)行為,。給予是一種額外的榮譽,,也有文化的吸引力。根據(jù)中國信息通信研究院去年發(fā)布的白皮書,,中國已成為僅次于美國的第二大人工智能技術(shù)貢獻(xiàn)者,。Meta首席人工智能科學(xué)家楊立昆也在社交媒體上表示,DeepSeek成功的最大收獲是保持人工智能模型開源的價值,以便任何人都能受益,。
隨著中國公司陸續(xù)發(fā)布兼具性能與價格優(yōu)勢甚至開源的大模型,,中美在人工智能上的差距正在縮小。不過,,多名專家表示仍需關(guān)注中國人工智能實現(xiàn)“從0到1”的能力,。清華大學(xué)計算機系長聘副教授劉知遠(yuǎn)認(rèn)為,AGI新技術(shù)還在加速演進(jìn),,未來發(fā)展路徑還不明確,。接下來如何在迷霧中開拓新路才是更大的挑戰(zhàn)。
短短一個月內(nèi),,中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:21:32DeepSeek大模型強在哪短短一個月內(nèi),中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型——DeepSeek-V3和DeepSeek-R1
2025-01-26 10:34:01DeepSeek讓Meta深陷恐慌短短一個月內(nèi),中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-26 15:51:02DeepSeek新模型火到海外短短一個月內(nèi),,中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:52:31DeepSeek刷屏硅谷背后DeepSeek 給硅谷帶來的震撼持續(xù)不斷,。與幾個月前《黑神話·悟空》在歐美受到的追捧相比,DeepSeek 的出現(xiàn)可謂石破天驚,,充滿了各種不可能和不合理
2025-01-26 14:46:44起底讓硅谷難安的DeepSeek