中國人工智能初創(chuàng)公司深度求索(DeepSeek)24日深夜低調(diào)上線了DeepSeek-V3的新版本DeepSeek-V3-0324,,參數(shù)量為6850億,。新版本在代碼,、數(shù)學,、推理等多個方面的能力顯著提升,,甚至代碼能力追平美國Anthropic公司大模型Claude 3.7,。外界對DeepSeek-V3-0324的關注不僅在于其性能提升,,還猜測這是否意味著更新一代的V4與R2大模型即將發(fā)布,。
關于DeepSeek-V3新版本的能力提升,,DeepSeek表示,,新版本代碼能力顯著提升,接近Claude 3.7水平,。例如,,有用戶在實測中發(fā)現(xiàn),V3-0324能一次性生成800行無錯誤的網(wǎng)頁代碼,,并實現(xiàn)動態(tài)響應式布局和交互效果,。此外,新版本的數(shù)學與邏輯推理能力也有所增強,,如經(jīng)典的“4升水壺問題”和數(shù)學競賽題,,部分表現(xiàn)接近專業(yè)推理模型。V3-0324采用MIT許可證,,允許自由修改,、分發(fā)及商業(yè)化應用,進一步降低了開發(fā)者的使用門檻,。
清華大學新聞學院,、人工智能學院教授沈陽認為,DeepSeek-V3-0324不僅是V3系列的一次迭代,,更是中國AI技術崛起的又一力證,。其在性能、效率和開源策略上的綜合優(yōu)勢使其在全球大語言模型領域占據(jù)重要地位,。未來,,DeepSeek可能通過推理能力提升和多模態(tài)擴展來鞏固技術領先優(yōu)勢,同時在中美競爭和社區(qū)生態(tài)中尋找平衡,。沈陽指出,,DeepSeek-V3-0324的發(fā)布看似是一次“小更新”,但其性能跳躍表明該團隊可能在為后續(xù)重大版本鋪路。
路透社今年2月底引述知情人士的說法稱,,DeepSeek原計劃在今年5月初發(fā)布R2,,但現(xiàn)在希望盡早推出,具體時間尚未透露,。此外,,DeepSeek希望新模型在代碼生成和多語言推理方面的表現(xiàn)進一步提升,。不過,,這些傳言并未得到DeepSeek公司的證實與回應。
沈陽表示,,DeepSeek-V3-0324的推出進一步凸顯中國AI企業(yè)在技術與成本上的競爭力,。美國對華GPU出口限制可能促使中國企業(yè)加速國產(chǎn)硬件適配,同時其開源模式或引發(fā)西方廠商的連鎖動作,,例如推出更強閉源模型,。他認為,2025年可能是中美AI競爭的分水嶺,。
在OpenAI公司的GPT大模型要把通用大模型和推理大模型融合在一起的背景下,,外界關注包括DeepSeek在內(nèi)的中國頭部大模型是否會最終出現(xiàn)這種合并的趨勢。沈陽認為這種可能性存在,,因為對于用戶來說,,更關心的是大模型能否給出更為智能、合理的參考答案,。
中國人工智能初創(chuàng)公司深度求索(DeepSeek)于3月24日深夜低調(diào)上線了新版本DeepSeek-V3-0324,,參數(shù)量達到6850億
2025-03-26 19:28:23DeepSeek低調(diào)扔了版更新2月23日,,2025全球開發(fā)者先鋒大會主辦方確認,近期頗受關注的DeepSeek參與了今年的大會,,但主要是以“閉門會議”的方式低調(diào)參會,,具體場次和出席人并未對外公布
2025-02-23 18:03:54DeepSeek低調(diào)參與GDC大會