短短一個月內,中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1。這兩款模型成本低廉,,性能卻與OpenAI相當,,引發(fā)了硅谷的震動,甚至讓Meta內部陷入恐慌,工程師們開始連夜嘗試復制DeepSeek的成果。
Scale AI創(chuàng)始人Alexander Wang在采訪中表示,DeepSeek在他們的測試中表現(xiàn)最佳,,與美國最好的模型相當。他之前曾評價說,,DeepSeek-V3是中國科技界帶給美國的一個苦澀教訓,,指出當美國休息時,,中國科技界以更低的成本、更快的速度和更強的實力迎頭趕上,。
中國AI的新進展也引起了國外媒體的關注,,他們認為這些新進展為硅谷敲響了警鐘。特別是在5000億美元的“星際之門”計劃公布之際,,DeepSeek以極低的價格建立了一個突破性的AI模型,,且沒有使用尖端芯片,這讓人們質疑巨額資本投入是否真的是最有效的方法,。
一名Meta員工在匿名平臺teamblind上發(fā)帖稱,,由于DeepSeek-V3的表現(xiàn),Meta已經進入恐慌模式,。DeepSeek-V3在基準測試中超越了Llama 4,,而其訓練預算僅為550萬美元。Meta工程師們正爭分奪秒地分析DeepSeek的技術,,試圖復制其成果,。管理層則因GenAI研發(fā)部門的巨額投入感到焦慮,因為一個高管的薪資就超過了整個DeepSeek V3的訓練成本,。
去年12月27日,,DeepSeek推出了開源模型DeepSeek-V3,在聊天機器人競技場排名第七,,在開源模型中排名第一,并被認為是全球前十中性價比最高的模型,。今年1月20日,,DeepSeek正式開源R1推理模型,允許所有人遵循MIT License蒸餾R1訓練其他模型,。1月24日,,DeepSeek-R1在聊天機器人競技場綜合榜單上排名第三,與頂尖推理模型o1并列,。在高難度提示詞,、代碼和數學等技術性領域,DeepSeek-R1表現(xiàn)出色,,風格控制方面也與o1并列第一,。
著名投資公司A16z的創(chuàng)始人馬克·安德森稱贊Deepseek-R1是令人驚嘆的突破之一,而且還是開源的,。諾獎得主,、“AI教父”杰弗里·辛頓認為,中國的STEM教育比美國更好,,擁有更多受過良好教育的人才,,這為AI的發(fā)展提供了堅實的基礎,。盡管美國試圖通過限制英偉達芯片來減緩中國的發(fā)展,但這只會促使中國加速發(fā)展自己的技術,。
斯坦福大學和Epoch AI的研究人員預測,,到2027年,最大型模型的訓練成本將超過10億美元,。但DeepSeek完全不同,,它的訓練成本并不昂貴,有可能徹底改變訓練和推理領域的游戲規(guī)則,。有投資者甚至認為,,美股芯片股的股價也會面臨挑戰(zhàn)。
最近四天,,國外媒體紛紛聚焦DeepSeek,,并一致認為中國大模型的新進展為硅谷敲響了警鐘。Business Insider報道稱,,DeepSeek-R1模型秉承開放精神,,完全開源,給美國AI玩家?guī)砹寺闊?。CNBC邀請Perplexity CEO Aravind Srinivas分析為何DeepSeek會引發(fā)人們對美國在AI領域的全球領先地位是否正在縮小的擔憂,。英國《金融時報》報道,加州大學伯克利分校AI政策研究員Ritwik Gupta指出,,中國的系統(tǒng)工程師人才庫比美國大得多,,能夠更便宜地訓練和運行模型。
短短一個月內,,中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:21:32DeepSeek大模型強在哪白頭鷹再次針對一家小公司采取行動,使用的依舊是那些熟悉的手段,。近期,,一家初創(chuàng)公司推出的DeepSeek軟件在全球范圍內引起轟動,在160多個國家的AI軟件下載排行榜上位居榜首
2025-02-04 19:33:47DeepSeek美股泡沫得以延續(xù)短短一個月內,,中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型——DeepSeek-V3和DeepSeek-R1
2025-01-26 10:34:01DeepSeek讓Meta深陷恐慌中國國產大模型Deepseek在硅谷引起了轟動,。從斯坦福到麻省理工,Deepseek R1幾乎一夜之間成為美國頂尖大學研究人員的首選模型
2025-01-27 15:33:19媒體揭秘國產大模型DeepSeek