5月29日凌晨,DeepSeek-R1-0528正式在Hugging Face平臺開源,。此前一日,,DeepSeek官方宣布DeepSeek-R1模型已完成小版本試升級,用戶可通過官方網頁,、App,、小程序進行測試,API接口和使用方式保持不變,。
此次更新中,,模型代碼能力的提升最為顯著。知名代碼測試平臺LiveCodeBench顯示,,更新后的R1性能可以媲美OpenAI o3模型的高版本,。除代碼能力外,新版本模型的文本理解與推理能力也實現(xiàn)跨越式升級,。其上下文長度拓展至128k,,長文本提取的準確率顯著提升。
知名AI評論人Haider在社交媒體上評價稱,,這是開源的一大勝利,。瑞士IT咨詢公司CTOL Digital Solutions首席執(zhí)行官Max Zhang則表示,在這一“小”進步之后,,可以期待更大突破的到來,。
盡管DeepSeek延續(xù)了一貫的低調風格,將此次升級定義為“小版本升級”,,但眾多開發(fā)者實測后發(fā)現(xiàn),,升級后的DeepSeek-R1模型能力實現(xiàn)了跨越式提升。編碼能力方面,,更新后的DeepSeek-R1性能接近OpenAI在4月中旬發(fā)布的o4-mini和o3模型高版本,。據(jù)測試者反饋,,DeepSeek-R1-0528能夠一次性生成超千行無Bug代碼,并在HTML/CSS/JS動態(tài)交互實現(xiàn)中更加精準,。
此外,,新版本模型的文本理解與推理能力也大幅提升。在Extended NYT Connections基準測試中,,相比于前一代DeepSeek-R1,,最新的0528版本得分從38.6%大幅升至49.8%。目前,,ChatBot Arena已經“上架”了最新版本的DeepSeek-R1,,但還沒有任何的測試結果。
記者進行了編程能力實測,。第一個任務是俄羅斯方塊游戲開發(fā),。DeepSeek僅思考了7秒就開始輸出代碼,但初步生成的游戲無法正常運作,。調整提示詞后,,DeepSeek-R1-0528用時約3分30秒生成了代碼,游戲頁面色彩搭配鮮明且協(xié)調,,操作流暢,,具備了一個成熟俄羅斯方塊游戲應有的功能和體驗。
第二個任務是太陽系模擬與交互展示,。記者向R1提出要求——寫一個太陽系模擬網頁,,并且網頁可交互展示。R1思考時間較長,,耗時54秒后開始輸出代碼。整體完成度極高,,界面呈現(xiàn)和交互功能都達到了較高水平,,兼具科普性與趣味性。
第三個任務是設計英偉達最新財報網頁,。DeepSeek-R1生成的網頁視覺呈現(xiàn)良好,,數(shù)據(jù)基本準確無誤,還繪制了柱狀圖,、餅圖等圖表,,使復雜的數(shù)據(jù)變得一目了然。盡管在漲跌幅的顏色上有些細微差異,,但整體來看,,R1已充分彰顯其在復雜任務處理上的卓越潛力。
DeepSeek最新發(fā)布的R1模型升級版在全球AI領域掀起熱議,,多位國際主流科技大佬及行業(yè)高管紛紛發(fā)聲,,盛贊其技術突破,。機器學習研究者kalomaze贊嘆道,“DeepSeek太出色了,?!盚yperbolic Labs聯(lián)合創(chuàng)始人兼首席技術官Yuchen Jin表示,新版R1似乎是唯一能回答9.9減9.11等于幾的模型,。知名AI評論人Haider直呼,,這是開源的一大勝利。AI撰稿人喬治·霍普金表示,,DeepSeek的R1模型更新后,,推理和輸出能力大幅提升,標志著中國在全球AI競賽中的影響力日益增強,。瑞士IT咨詢公司CTOL Digital Solutions首席執(zhí)行官Max Zhang指出,,DeepSeek的最新版R1模型正悄然成為谷歌Gemini 2.5 Pro的強勁競爭對手,這一發(fā)展不僅是技術進步,,更是全球AI競賽中的一個關鍵節(jié)點,。
5月28日晚,,DeepSeek在官方交流群中宣布R1模型已完成小版本試升級。今年3月,,DeepSeek對V3模型進行小版本升級時也采用了同樣的方式,,先通過官方交流群宣布,隨后才公布具體更新內容
2025-05-30 08:21:34Deepseek升級微軟今日宣布,,通過Azure AI Foundry接入DeepSeek-R1 7B和14B蒸餾模型,,為Copilot+ PC提供本地運行這兩種模型的能力
2025-03-04 22:11:09微軟擁抱DeepSeek近日,騰訊,、百度,、阿里等國內互聯(lián)網企業(yè)紛紛宣布與DeepSeek合作,人工智能領域的“朋友圈”不斷擴大,,引起業(yè)界高度關注
2025-02-22 23:32:37媒體3月24日晚,DeepSeek發(fā)布了模型更新——DeepSeek-V3-0324,。這次更新是DeepSeek V3模型的小版本升級,,并非市場期待的DeepSeek-V4或R2
2025-03-25 09:04:50DeepSeek發(fā)布V3模型更新