Anthropic 公司在北京時間5月23日0點30分舉辦的活動中,推出了Claude Opus 4和Claude Sonnet 4新一代語言模型,,在結(jié)構(gòu)化推理、軟件工程和自主代理行為等領(lǐng)域?qū)崿F(xiàn)了重大進步,。
Claude Opus 4被定位為Anthropic迄今為止最強大的模型,專為處理復(fù)雜的推理流程和軟件開發(fā)場景設(shè)計,。測試數(shù)據(jù)顯示,,該模型在SWE-bench基準(zhǔn)測試中準(zhǔn)確率達到72.5%,在TerminalBench測試中準(zhǔn)確率為43.2%,。Opus 4在軟件環(huán)境中展現(xiàn)出強大的自主行為,,得益于改進的內(nèi)存管理、更廣泛的上下文保留以及更強大的內(nèi)部規(guī)劃機制,。據(jù)Rakuten測試數(shù)據(jù),,它可以連續(xù)進行近7小時的代碼生成和任務(wù)執(zhí)行,刷新了AI世界紀(jì)錄,,遠超前代Claude 3 Opus(不到1小時),。
Anthropic聲稱其AI模型不是為了消除工作崗位,而是一種將日常工作自動化的工具,。不過有媒體認為,,Claude 4系列問世后,將改變AI的使用方式,,使其從完成單一任務(wù)的輔助工具轉(zhuǎn)變?yōu)榫邆涓鼜?、更廣泛功能的“AI同事”,可以自動工作幾乎一個完整的工作班次,。
Claude Sonnet 4取代了前代Claude 3.5 Sonnet,,以更穩(wěn)定的架構(gòu)提升速度與質(zhì)量,同時未顯著增加計算成本,。該模型針對中規(guī)模部署優(yōu)化,,適合需要在成本與性能間權(quán)衡的場景。盡管推理能力不及Opus 4,,但Sonnet 4繼承了許多架構(gòu)升級,,支持多文件代碼導(dǎo)航、中間工具使用和結(jié)構(gòu)化文本處理,,延遲表現(xiàn)更佳,。它成為Claude.ai免費用戶的默認模型,并通過API提供服務(wù),適用于輕量開發(fā)工具,、用戶助手和分析流程,。
礦產(chǎn)資源是經(jīng)濟社會發(fā)展的重要物質(zhì)基礎(chǔ),,礦產(chǎn)資源勘查開發(fā)事關(guān)國計民生和國家安全,。
2025-02-14 11:26:05新一輪找礦行動一場關(guān)于中國空軍未來的爭論正在發(fā)酵——殲-36隱身戰(zhàn)斗轟炸機的橫空出世,,讓不少人開始懷疑轟-20戰(zhàn)略轟炸機的研發(fā)是否還有必要
2025-01-09 23:34:20殲36橫空出世轟20還有用嗎