外界熱議DeepSeek低調(diào)“上新” V4與R2猜想再起

小大

用微信掃描二維碼
分享至好友和朋友圈

關鍵詞：

2025-03-26 14:15:56 環(huán)球時報

中國人工智能初創(chuàng)公司深度求索（DeepSeek）24日深夜低調(diào)上線了DeepSeek-V3的新版本DeepSeek-V3-0324,，參數(shù)量為6850億,。新版本在代碼,、數(shù)學,、推理等多個方面的能力顯著提升,，甚至代碼能力追平美國Anthropic公司大模型Claude 3.7,。外界對DeepSeek-V3-0324的關注不僅在于其性能提升,，還猜測這是否意味著更新一代的V4與R2大模型即將發(fā)布,。

關于DeepSeek-V3新版本的能力提升,，DeepSeek表示,，新版本代碼能力顯著提升，接近Claude 3.7水平,。例如,，有用戶在實測中發(fā)現(xiàn)，V3-0324能一次性生成800行無錯誤的網(wǎng)頁代碼,，并實現(xiàn)動態(tài)響應式布局和交互效果,。此外，新版本的數(shù)學與邏輯推理能力也有所增強,，如經(jīng)典的“4升水壺問題”和數(shù)學競賽題,，部分表現(xiàn)接近專業(yè)推理模型。V3-0324采用MIT許可證,，允許自由修改,、分發(fā)及商業(yè)化應用，進一步降低了開發(fā)者的使用門檻,。

清華大學新聞學院,、人工智能學院教授沈陽認為，DeepSeek-V3-0324不僅是V3系列的一次迭代,，更是中國AI技術崛起的又一力證,。其在性能、效率和開源策略上的綜合優(yōu)勢使其在全球大語言模型領域占據(jù)重要地位,。未來,，DeepSeek可能通過推理能力提升和多模態(tài)擴展來鞏固技術領先優(yōu)勢，同時在中美競爭和社區(qū)生態(tài)中尋找平衡,。沈陽指出,，DeepSeek-V3-0324的發(fā)布看似是一次“小更新”，但其性能跳躍表明該團隊可能在為后續(xù)重大版本鋪路。

路透社今年2月底引述知情人士的說法稱,，DeepSeek原計劃在今年5月初發(fā)布R2,，但現(xiàn)在希望盡早推出，具體時間尚未透露,。此外,，DeepSeek希望新模型在代碼生成和多語言推理方面的表現(xiàn)進一步提升,。不過,，這些傳言并未得到DeepSeek公司的證實與回應。

沈陽表示,，DeepSeek-V3-0324的推出進一步凸顯中國AI企業(yè)在技術與成本上的競爭力,。美國對華GPU出口限制可能促使中國企業(yè)加速國產(chǎn)硬件適配，同時其開源模式或引發(fā)西方廠商的連鎖動作,，例如推出更強閉源模型,。他認為，2025年可能是中美AI競爭的分水嶺,。

在OpenAI公司的GPT大模型要把通用大模型和推理大模型融合在一起的背景下,，外界關注包括DeepSeek在內(nèi)的中國頭部大模型是否會最終出現(xiàn)這種合并的趨勢。沈陽認為這種可能性存在,，因為對于用戶來說,，更關心的是大模型能否給出更為智能、合理的參考答案,。

(責任編輯：張小花 TT1000)

關閉

外界熱議DeepSeek低調(diào)“上新” V4與R2猜想再起

相關新聞

今日熱點

頻道熱點