此外,,新版本模型的文本理解與推理能力也大幅提升,。在Extended NYT Connections基準(zhǔn)測試中,相比于前一代DeepSeek-R1,,最新的0528版本得分從38.6%大幅升至49.8%,。目前,ChatBot Arena已經(jīng)“上架”了最新版本的DeepSeek-R1,,但還沒有任何的測試結(jié)果,。
記者進行了編程能力實測。第一個任務(wù)是俄羅斯方塊游戲開發(fā),。DeepSeek僅思考了7秒就開始輸出代碼,,但初步生成的游戲無法正常運作。調(diào)整提示詞后,,DeepSeek-R1-0528用時約3分30秒生成了代碼,,游戲頁面色彩搭配鮮明且協(xié)調(diào),操作流暢,,具備了一個成熟俄羅斯方塊游戲應(yīng)有的功能和體驗,。
第二個任務(wù)是太陽系模擬與交互展示。記者向R1提出要求——寫一個太陽系模擬網(wǎng)頁,,并且網(wǎng)頁可交互展示,。R1思考時間較長,耗時54秒后開始輸出代碼,。整體完成度極高,,界面呈現(xiàn)和交互功能都達到了較高水平,兼具科普性與趣味性,。
微軟今日宣布,通過Azure AI Foundry接入DeepSeek-R1 7B和14B蒸餾模型,,為Copilot+ PC提供本地運行這兩種模型的能力
2025-03-04 22:11:09微軟擁抱DeepSeek近日,,騰訊、百度,、阿里等國內(nèi)互聯(lián)網(wǎng)企業(yè)紛紛宣布與DeepSeek合作,,人工智能領(lǐng)域的“朋友圈”不斷擴大,引起業(yè)界高度關(guān)注
2025-02-22 23:32:37媒體3月24日晚,,DeepSeek發(fā)布了模型更新——DeepSeek-V3-0324。這次更新是DeepSeek V3模型的小版本升級,,并非市場期待的DeepSeek-V4或R2
2025-03-25 09:04:50DeepSeek發(fā)布V3模型更新