DeepSeek“低調(diào)”扔了版更新性能躍升引猜測(cè)

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-03-26 19:28:23 大皖新聞

中國(guó)人工智能初創(chuàng)公司深度求索（DeepSeek）于3月24日深夜低調(diào)上線了新版本DeepSeek-V3-0324,，參數(shù)量達(dá)到6850億。該版本在代碼,、數(shù)學(xué)和推理等多個(gè)方面的能力顯著提升,，尤其是代碼能力已經(jīng)接近美國(guó)Anthropic公司的大模型Claude 3.7。

外界對(duì)DeepSeek-V3-0324的關(guān)注不僅在于其能力提升,，還猜測(cè)這是否預(yù)示著更新一代的V4與R2大模型即將發(fā)布,。據(jù)DeepSeek介紹，新版本的主要改進(jìn)包括：代碼能力顯著增強(qiáng),，能夠一次性生成800行無(wú)錯(cuò)誤的網(wǎng)頁(yè)代碼,，并實(shí)現(xiàn)動(dòng)態(tài)響應(yīng)式布局和交互效果,；數(shù)學(xué)與邏輯推理能力也有所提高,，部分表現(xiàn)接近專業(yè)推理模型；此外,，V3-0324采用MIT許可證,，允許自由修改、分發(fā)及商業(yè)化應(yīng)用,，降低了開(kāi)發(fā)者的使用門檻,。

清華大學(xué)新聞學(xué)院和人工智能學(xué)院教授沈陽(yáng)表示，DeepSeek-V3-0324不僅是V3系列的一次迭代，也是中國(guó)AI技術(shù)崛起的重要標(biāo)志,。其在性能,、效率和開(kāi)源策略上的綜合優(yōu)勢(shì)使其在全球大語(yǔ)言模型領(lǐng)域占據(jù)重要地位。未來(lái),，DeepSeek可能通過(guò)進(jìn)一步提升推理能力和擴(kuò)展多模態(tài)功能來(lái)鞏固技術(shù)領(lǐng)先優(yōu)勢(shì),，同時(shí)在中美競(jìng)爭(zhēng)和社區(qū)生態(tài)中尋找平衡點(diǎn)。盡管這次更新看似是一次“小更新”,，但其性能跳躍表明該團(tuán)隊(duì)可能在為后續(xù)重大版本做準(zhǔn)備,。

路透社今年2月底報(bào)道，DeepSeek原計(jì)劃在今年5月初發(fā)布R2,，但現(xiàn)在希望盡早推出,，具體時(shí)間尚未透露。DeepSeek希望新模型在代碼生成和多語(yǔ)言推理方面的表現(xiàn)進(jìn)一步提升,。不過(guò),，這些傳言沒(méi)有得到DeepSeek公司的證實(shí)或回應(yīng)。

沈陽(yáng)指出,，DeepSeek-V3-0324的推出進(jìn)一步凸顯了中國(guó)AI企業(yè)在技術(shù)和成本上的競(jìng)爭(zhēng)力,。美國(guó)對(duì)中國(guó)GPU出口限制可能促使中國(guó)企業(yè)加速國(guó)產(chǎn)硬件適配，同時(shí)其開(kāi)源模式可能會(huì)引發(fā)西方廠商的連鎖反應(yīng),，例如推出更強(qiáng)的閉源模型,。他認(rèn)為2025年可能是中美AI競(jìng)爭(zhēng)的關(guān)鍵節(jié)點(diǎn)。

在OpenAI公司計(jì)劃將通用大模型和推理大模型融合在一起的背景下,，外界關(guān)注包括DeepSeek在內(nèi)的中國(guó)頭部大模型是否會(huì)跟隨這一趨勢(shì),。沈陽(yáng)認(rèn)為這種可能性存在，因?yàn)橛脩舾P(guān)心的是大模型能否提供更為智能和合理的參考答案,，而不關(guān)心具體使用的模型類型,。

(責(zé)任編輯：張佳鑫 0764)

關(guān)閉

DeepSeek“低調(diào)”扔了版更新 性能躍升引猜測(cè)

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

DeepSeek“低調(diào)”扔了版更新性能躍升引猜測(cè)