短短一個月內(nèi),,中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型——DeepSeek-V3和DeepSeek-R1,。這兩款模型成本低廉,,性能卻與OpenAI相當,,讓硅谷震驚,,甚至引發(fā)了Meta內(nèi)部的恐慌,,工程師們開始連夜嘗試復(fù)制DeepSeek的成果,。
Scale AI創(chuàng)始人Alexander Wang在采訪中表示,,DeepSeek在他們的測試中表現(xiàn)最好,,與美國最好的模型相當。他之前還提到,,DeepSeek-V3是中國科技界帶給美國的一個教訓(xùn),,強調(diào)中國以更低的成本、更快的速度和更強的實力追趕上來,。
國外媒體也紛紛報道了中國大模型的新進展,,認為這對硅谷敲響了警鐘。在5000億美元的“星際之門”計劃公布之際,DeepSeek以極低的價格建立了一個突破性的AI模型,,且未使用尖端芯片,,這讓人們質(zhì)疑巨額資本投入是否是最有效的方法。
一位匿名的Meta員工透露,,DeepSeek-V3在基準測試中已經(jīng)超越Llama 4,,更令人尷尬的是,這家僅用550萬美元訓(xùn)練預(yù)算的中國公司做到了這一點,。Meta的工程師們正在爭分奪秒地分析DeepSeek,,試圖復(fù)制其中的技術(shù)。管理層則為GenAI研發(fā)部門的巨額投入而發(fā)愁,,尤其是當一個高管的薪資就超過訓(xùn)練整個DeepSeek V3的成本時,。
去年12月27日,DeepSeek推出開源模型DeepSeek-V3,,在聊天機器人競技場中排名第七,,在開源模型中排第一,是全球前十中性價比最高的模型,。今年1月20日,,DeepSeek正式開源R1推理模型,允許所有人在遵循MIT License的情況下蒸餾R1訓(xùn)練其他模型,。1月24日,,DeepSeek-R1在聊天機器人競技場綜合榜單上排名第三,與頂尖推理模型o1并列,。在高難度提示詞,、代碼和數(shù)學(xué)等技術(shù)性領(lǐng)域,DeepSeek-R1位列第一,。在風(fēng)格控制方面,,DeepSeek-R1與o1并列第一,表明其在理解和遵循用戶指令方面表現(xiàn)出色,。Artificial-Analysis的初步測試顯示,,DeepSeek-R1在AI分析質(zhì)量指數(shù)中取得第二高分,價格僅為o1的約三十分之一,。
著名投資公司A16z的創(chuàng)始人馬克·安德森稱,,Deepseek-R1是他見過最令人驚嘆的突破之一,而且還是開源的,。A16z合伙人Anjney Midha也表示,,DeepSeek-R1幾乎一夜之間成為美國頂尖大學(xué)研究人員的首選模型。諾獎得主,、“AI教父”杰弗里·辛頓認為,,中國的STEM教育比美國更好,,擁有更多受過良好教育的人才,這為AI的發(fā)展提供了堅實基礎(chǔ),。
斯坦福大學(xué)和Epoch AI的研究人員預(yù)測,,到2027年,最大型的模型訓(xùn)練成本將超過10億美元,。Gartner則預(yù)測,,到2028年Google、Microsoft和AWS等超大規(guī)模企業(yè)僅在AI服務(wù)器上的支出就將高達5000億美元,。然而,,DeepSeek的低成本訓(xùn)練模式可能徹底改變這一局面。Noah"s Arc資本管理公司認為,,DeepSeek-V3模型有可能徹底改變訓(xùn)練和推理領(lǐng)域的游戲規(guī)則,。
美股大V“THE SHORT BEAR”指出,如果擊敗OpenAI只需要5500萬美元,,那么這個行業(yè)的商業(yè)化會比很多人預(yù)想的要快很多,。財經(jīng)記者Holger Zschaepitz也表示,DeepSeek以極低的價格建立了一個突破性的AI模型,,這讓人們質(zhì)疑該行業(yè)數(shù)千億美元資本支出的效用,。有投資者甚至認為,美股芯片股的股價也會面臨挑戰(zhàn),。
值得注意的是,,DeepSeek-V3發(fā)布后,英偉達股價下跌了2%,。而DeepSeek-R1引發(fā)海外大討論后,1月24日英偉達股價又大跌了3.12%,。最近四天,,國外媒體紛紛聚焦DeepSeek,并一致認為中國大模型的新進展為硅谷敲響了警鐘,。加州大學(xué)伯克利分校AI政策研究員Ritwik Gupta表示,,DeepSeek最近發(fā)布的模型表明“AI能力沒有護城河”,中國的系統(tǒng)工程師人才庫比美國大得多,,他們懂得如何充分利用計算資源來更便宜地訓(xùn)練和運行模型,。
短短一個月內(nèi),中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:21:32DeepSeek大模型強在哪據(jù)韓國《朝鮮日報》27日報道,,韓國總統(tǒng)尹錫悅當天表示,,最近以不特定人群為對象的深度偽造技術(shù)影像通過社交媒體迅速傳播,不少受害者是未成年人,,加害者也大多10多歲,。
2024-08-29 17:12:22韓女性深陷恐慌22萬人被色情片AI換臉