中國人工智能初創(chuàng)公司深度求索(DeepSeek)24日深夜低調上線了DeepSeek-V3的新版本DeepSeek-V3-0324,,參數量為6850億,。新版本在代碼、數學,、推理等多個方面的能力顯著提升,,甚至代碼能力追平美國Anthropic公司大模型Claude 3.7。外界對DeepSeek-V3-0324的關注不僅在于其性能提升,,還猜測這是否意味著更新一代的V4與R2大模型即將發(fā)布,。
關于DeepSeek-V3新版本的能力提升,DeepSeek表示,,新版本代碼能力顯著提升,,接近Claude 3.7水平。例如,,有用戶在實測中發(fā)現(xiàn),,V3-0324能一次性生成800行無錯誤的網頁代碼,并實現(xiàn)動態(tài)響應式布局和交互效果,。此外,,新版本的數學與邏輯推理能力也有所增強,如經典的“4升水壺問題”和數學競賽題,,部分表現(xiàn)接近專業(yè)推理模型,。V3-0324采用MIT許可證,允許自由修改,、分發(fā)及商業(yè)化應用,,進一步降低了開發(fā)者的使用門檻。
清華大學新聞學院,、人工智能學院教授沈陽認為,,DeepSeek-V3-0324不僅是V3系列的一次迭代,更是中國AI技術崛起的又一力證,。其在性能,、效率和開源策略上的綜合優(yōu)勢使其在全球大語言模型領域占據重要地位,。未來,DeepSeek可能通過推理能力提升和多模態(tài)擴展來鞏固技術領先優(yōu)勢,,同時在中美競爭和社區(qū)生態(tài)中尋找平衡,。沈陽指出,DeepSeek-V3-0324的發(fā)布看似是一次“小更新”,,但其性能跳躍表明該團隊可能在為后續(xù)重大版本鋪路,。
路透社今年2月底引述知情人士的說法稱,DeepSeek原計劃在今年5月初發(fā)布R2,,但現(xiàn)在希望盡早推出,,具體時間尚未透露。此外,,DeepSeek希望新模型在代碼生成和多語言推理方面的表現(xiàn)進一步提升,。不過,這些傳言并未得到DeepSeek公司的證實與回應,。
沈陽表示,,DeepSeek-V3-0324的推出進一步凸顯中國AI企業(yè)在技術與成本上的競爭力。美國對華GPU出口限制可能促使中國企業(yè)加速國產硬件適配,,同時其開源模式或引發(fā)西方廠商的連鎖動作,,例如推出更強閉源模型。他認為,,2025年可能是中美AI競爭的分水嶺,。
在OpenAI公司的GPT大模型要把通用大模型和推理大模型融合在一起的背景下,外界關注包括DeepSeek在內的中國頭部大模型是否會最終出現(xiàn)這種合并的趨勢,。沈陽認為這種可能性存在,,因為對于用戶來說,更關心的是大模型能否給出更為智能,、合理的參考答案,。
2月23日,2025全球開發(fā)者先鋒大會主辦方確認,,近期頗受關注的DeepSeek參與了今年的大會,,但主要是以“閉門會議”的方式低調參會,具體場次和出席人并未對外公布
2025-02-23 18:03:54DeepSeek低調參與GDC大會