Claude 4橫空出世有啥重大突破復雜推理與軟件開發(fā)新高度

小大

用微信掃描二維碼
分享至好友和朋友圈

關鍵詞：

2025-05-23 10:04:14 IT之家

Anthropic 公司在北京時間5月23日0點30分舉辦的活動中，推出了Claude Opus 4和Claude Sonnet 4新一代語言模型,，在結構化推理,、軟件工程和自主代理行為等領域實現(xiàn)了重大進步。

Claude 4橫空出世有啥重大突破

Claude Opus 4被定位為Anthropic迄今為止最強大的模型,，專為處理復雜的推理流程和軟件開發(fā)場景設計,。測試數(shù)據(jù)顯示，該模型在SWE-bench基準測試中準確率達到72.5%,，在TerminalBench測試中準確率為43.2%,。Opus 4在軟件環(huán)境中展現(xiàn)出強大的自主行為，得益于改進的內(nèi)存管理,、更廣泛的上下文保留以及更強大的內(nèi)部規(guī)劃機制,。據(jù)Rakuten測試數(shù)據(jù)，它可以連續(xù)進行近7小時的代碼生成和任務執(zhí)行,，刷新了AI世界紀錄,，遠超前代Claude 3 Opus（不到1小時）。

Claude 4橫空出世有啥重大突破復雜推理與軟件開發(fā)新高度

Anthropic聲稱其AI模型不是為了消除工作崗位,，而是一種將日常工作自動化的工具,。不過有媒體認為，Claude 4系列問世后，將改變AI的使用方式,，使其從完成單一任務的輔助工具轉變?yōu)榫邆涓鼜?、更廣泛功能的“AI同事”，可以自動工作幾乎一個完整的工作班次,。

Claude 4橫空出世有啥重大突破復雜推理與軟件開發(fā)新高度

Claude Sonnet 4取代了前代Claude 3.5 Sonnet,，以更穩(wěn)定的架構提升速度與質量，同時未顯著增加計算成本,。該模型針對中規(guī)模部署優(yōu)化,，適合需要在成本與性能間權衡的場景。盡管推理能力不及Opus 4,，但Sonnet 4繼承了許多架構升級,，支持多文件代碼導航、中間工具使用和結構化文本處理,，延遲表現(xiàn)更佳,。它成為Claude.ai免費用戶的默認模型，并通過API提供服務,，適用于輕量開發(fā)工具,、用戶助手和分析流程。

Claude 4橫空出世有啥重大突破復雜推理與軟件開發(fā)新高度

兩款模型均具備混合推理能力,，提供“快速模式”用于低延遲的簡短對話任務,，以及“擴展思考模式”用于需要深度推理和多輪代理行為的復雜任務。這種雙模式策略讓用戶能根據(jù)任務復雜度靈活分配計算資源,。此外,，Claude Opus 4和Sonnet 4可通過多個云平臺訪問，包括Anthropic的Claude API,、Amazon Bedrock和Google Cloud Vertex AI等,，支持從自主代理到代碼分析等多種企業(yè)應用場景。

Claude 4橫空出世有啥重大突破復雜推理與軟件開發(fā)新高度

(責任編輯：zx0176)

關閉

Claude 4橫空出世有啥重大突破 復雜推理與軟件開發(fā)新高度

相關新聞

今日熱點

頻道熱點

Claude 4橫空出世有啥重大突破復雜推理與軟件開發(fā)新高度