Deepseek本次升級有多大提升代碼與文本能力顯著增強

小大

用微信掃描二維碼
分享至好友和朋友圈

關鍵詞：

2025-05-30 17:24:49 每日經濟新聞

5月29日凌晨，DeepSeek-R1-0528正式在Hugging Face平臺開源,。此前一日,，DeepSeek官方宣布DeepSeek-R1模型已完成小版本試升級，用戶可通過官方網頁,、App,、小程序進行測試，API接口和使用方式保持不變,。

Deepseek本次升級有多大提升

此次更新中,，模型代碼能力的提升最為顯著。知名代碼測試平臺LiveCodeBench顯示,，更新后的R1性能可以媲美OpenAI o3模型的高版本,。除代碼能力外，新版本模型的文本理解與推理能力也實現(xiàn)跨越式升級,。其上下文長度拓展至128k,，長文本提取的準確率顯著提升。

Deepseek本次升級有多大提升代碼與文本能力顯著增強

知名AI評論人Haider在社交媒體上評價稱,，這是開源的一大勝利,。瑞士IT咨詢公司CTOL Digital Solutions首席執(zhí)行官Max Zhang則表示，在這一“小”進步之后,，可以期待更大突破的到來,。

Deepseek本次升級有多大提升代碼與文本能力顯著增強

盡管DeepSeek延續(xù)了一貫的低調風格，將此次升級定義為“小版本升級”,，但眾多開發(fā)者實測后發(fā)現(xiàn),，升級后的DeepSeek-R1模型能力實現(xiàn)了跨越式提升。編碼能力方面,，更新后的DeepSeek-R1性能接近OpenAI在4月中旬發(fā)布的o4-mini和o3模型高版本,。據(jù)測試者反饋,，DeepSeek-R1-0528能夠一次性生成超千行無Bug代碼，并在HTML/CSS/JS動態(tài)交互實現(xiàn)中更加精準,。

Deepseek本次升級有多大提升代碼與文本能力顯著增強

此外,，新版本模型的文本理解與推理能力也大幅提升。在Extended NYT Connections基準測試中,，相比于前一代DeepSeek-R1,，最新的0528版本得分從38.6%大幅升至49.8%。目前,，ChatBot Arena已經“上架”了最新版本的DeepSeek-R1,，但還沒有任何的測試結果。

Deepseek本次升級有多大提升代碼與文本能力顯著增強

記者進行了編程能力實測,。第一個任務是俄羅斯方塊游戲開發(fā),。DeepSeek僅思考了7秒就開始輸出代碼，但初步生成的游戲無法正常運作,。調整提示詞后,，DeepSeek-R1-0528用時約3分30秒生成了代碼，游戲頁面色彩搭配鮮明且協(xié)調,，操作流暢,，具備了一個成熟俄羅斯方塊游戲應有的功能和體驗。

Deepseek本次升級有多大提升代碼與文本能力顯著增強

第二個任務是太陽系模擬與交互展示,。記者向R1提出要求——寫一個太陽系模擬網頁,，并且網頁可交互展示。R1思考時間較長,，耗時54秒后開始輸出代碼。整體完成度極高,，界面呈現(xiàn)和交互功能都達到了較高水平,，兼具科普性與趣味性。

Deepseek本次升級有多大提升代碼與文本能力顯著增強

第三個任務是設計英偉達最新財報網頁,。DeepSeek-R1生成的網頁視覺呈現(xiàn)良好,，數(shù)據(jù)基本準確無誤，還繪制了柱狀圖,、餅圖等圖表,，使復雜的數(shù)據(jù)變得一目了然。盡管在漲跌幅的顏色上有些細微差異,，但整體來看,，R1已充分彰顯其在復雜任務處理上的卓越潛力。

Deepseek本次升級有多大提升代碼與文本能力顯著增強

DeepSeek最新發(fā)布的R1模型升級版在全球AI領域掀起熱議,，多位國際主流科技大佬及行業(yè)高管紛紛發(fā)聲,，盛贊其技術突破,。機器學習研究者kalomaze贊嘆道，“DeepSeek太出色了,?！盚yperbolic Labs聯(lián)合創(chuàng)始人兼首席技術官Yuchen Jin表示，新版R1似乎是唯一能回答9.9減9.11等于幾的模型,。知名AI評論人Haider直呼,，這是開源的一大勝利。AI撰稿人喬治·霍普金表示,，DeepSeek的R1模型更新后,，推理和輸出能力大幅提升，標志著中國在全球AI競賽中的影響力日益增強,。瑞士IT咨詢公司CTOL Digital Solutions首席執(zhí)行官Max Zhang指出,，DeepSeek的最新版R1模型正悄然成為谷歌Gemini 2.5 Pro的強勁競爭對手，這一發(fā)展不僅是技術進步,，更是全球AI競賽中的一個關鍵節(jié)點,。

Deepseek本次升級有多大提升代碼與文本能力顯著增強

(責任編輯：zhangxiaohua)

關閉

Deepseek本次升級有多大提升 代碼與文本能力顯著增強

相關新聞

今日熱點

頻道熱點

Deepseek本次升級有多大提升代碼與文本能力顯著增強