中國AI初創(chuàng)公司深度求索(DeepSeek)在短短一個月內(nèi)發(fā)布了兩款大模型,,分別是DeepSeek-V3和DeepSeek-R1,。這兩款模型成本低廉,,性能卻與OpenAI相當(dāng),,引起了硅谷的震驚,甚至引發(fā)了Meta內(nèi)部的恐慌,。工程師們開始連夜嘗試復(fù)制DeepSeek的成果,。
Scale AI創(chuàng)始人Alexander Wang表示,在他們的測試中,,DeepSeek的表現(xiàn)最佳,,與美國最好的模型相當(dāng)。他之前還評價說,,DeepSeek-V3是中國科技界帶給美國的一個苦澀教訓(xùn),,強調(diào)中國科技界以更低的成本、更快的速度和更強的實力追趕上來,。
中國AI的新進展引起了國外媒體的關(guān)注,,認為這些新進展為硅谷敲響了警鐘。尤其在5000億美元的“星際之門”計劃公布之際,,DeepSeek以極低的價格建立了一個突破性的AI模型,且沒有使用尖端芯片,,這讓人們質(zhì)疑巨額投入是否是最有效的方法,。
一名Meta員工在匿名平臺teamblind上發(fā)帖稱,Meta內(nèi)部因為DeepSeek的模型進入了恐慌模式,。DeepSeek-V3在基準測試中已經(jīng)超越了Llama 4,,而DeepSeek僅用550萬美元訓(xùn)練預(yù)算就達到了這一成就,。Meta工程師們正在爭分奪秒地分析DeepSeek的技術(shù),試圖復(fù)制其成果,。管理層也為GenAI研發(fā)部門的巨額投入感到焦慮,。
去年12月27日,DeepSeek推出了開源模型DeepSeek-V3,,在聊天機器人競技場排名第七,,在開源模型中排名第一。今年1月20日,,DeepSeek正式開源R1推理模型,,允許所有人在遵循MIT License的情況下蒸餾R1訓(xùn)練其他模型。1月24日,,DeepSeek-R1在聊天機器人競技場綜合榜單上排名第三,,與頂尖推理模型o1并列。在高難度提示詞,、代碼和數(shù)學(xué)等領(lǐng)域,,DeepSeek-R1表現(xiàn)優(yōu)異,位列第一,。在風(fēng)格控制方面,,DeepSeek-R1同樣表現(xiàn)出色,與o1并列第一,。
Artificial-Analysis對DeepSeek-R1的初始基準測試結(jié)果顯示,,該模型在AI分析質(zhì)量指數(shù)中取得第二高分,價格僅為o1的約三十分之一,。著名投資公司A16z的創(chuàng)始人馬克·安德森稱,,Deepseek-R1是他見過的最令人驚嘆、最令人印象深刻的突破之一,。A16z合伙人Anjney Midha也表示,,DeepSeek-R1幾乎一夜之間成為美國頂尖大學(xué)研究人員的首選模型。
對于中國AI為何能有如此快速的進展,,諾獎得主杰弗里·辛頓表示,,中國的STEM教育比美國更好,擁有更多受過良好教育的人才,,這為AI的發(fā)展提供了堅實的基礎(chǔ),。盡管美國試圖通過限制來減緩中國的發(fā)展,但這只會促使中國加速發(fā)展自己的技術(shù),。
斯坦福大學(xué)和Epoch AI的研究人員發(fā)表了一項研究表明,,到2027年,最大型的模型的訓(xùn)練成本將超過10億美元。Gartner預(yù)測,,到2028年Google,、Microsoft和AWS等超大規(guī)模企業(yè)僅在AI服務(wù)器上的支出就將高達5000億美元。但DeepSeek完全不同,,它的訓(xùn)練成本并不昂貴,。Noah"s Arc資本管理公司認為,DeepSeek-V3模型有可能徹底改變訓(xùn)練和推理領(lǐng)域的游戲規(guī)則,。
美股大V“THE SHORT BEAR”指出,,如果擊敗OpenAI只需要5500萬美元,那么這個行業(yè)的商業(yè)化會比很多人預(yù)想的要快很多,。著名財經(jīng)記者Holger Zschaepitz也表示,,DeepSeek以極低的價格建立了一個突破性的AI模型,這讓人們質(zhì)疑數(shù)千億美元資本支出的效用,。投資者Geiger Capital認為,,Deepseek和OpenAI一樣好,甚至更好,,但價格只有后者的3%,。
值得注意的是,DeepSeek-V3發(fā)布后,,英偉達股價下跌了2%,,而DeepSeek-R1引發(fā)海外大討論后,1月24日英偉達股價又大跌了3.12%,。最近四天,,國外媒體紛紛聚焦DeepSeek,并一致認為中國大模型的新進展為硅谷敲響了警鐘,。
短短一個月內(nèi),,中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型——DeepSeek-V3和DeepSeek-R1
2025-01-26 10:34:01DeepSeek讓Meta深陷恐慌短短一個月內(nèi),,中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:52:31DeepSeek刷屏硅谷背后短短一個月內(nèi),,中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:21:32DeepSeek大模型強在哪Meta已經(jīng)批準美國政府機構(gòu)和國防承包商使用其人工智能模型,此舉旨在讓公司的技術(shù)在美國軍事和國家安全事務(wù)中發(fā)揮關(guān)鍵作用
2024-11-05 11:13:29Meta向美政府和國防承包商開放AI大模型