全球首個混合推理模型Claude 3.7降世,!Anthropic終于發(fā)布了其首款混合推理模型Claude 3.7 Sonnet,,這是迄今為止最智能的Claude系列模型,。它能夠及時響應(yīng),,并進(jìn)行可擴展的逐步思考,。簡單來說,,這個模型具備兩種思考方式,。
例如,,用戶可以將一個復(fù)雜的數(shù)學(xué)問題如蒙提霍爾問題交給Claude 3.7 Sonnet,,并選擇“擴展”模式。在這種模式下,,Claude 3.7 Sonnet會展示詳細(xì)的思維過程,,并在52秒內(nèi)完成解答。目前,,所有人都可以免費使用Claude 3.7 Sonnet,,但“擴展思考”模式尚未上線。
在多項基準(zhǔn)測試中,Claude 3.7 Sonnet在數(shù)學(xué),、物理,、指令執(zhí)行和編程等方面刷新了SOTA記錄。與上一代Claude 3.5相比,,其數(shù)學(xué)和編碼能力提升了10%以上,。除了數(shù)學(xué)領(lǐng)域,Claude 3.7 Sonnet(64k擴展思考)幾乎完全碾壓o3-mini和DeepSeek R1,,在某些方面甚至與Grok 3不相上下,。API用戶可以精確控制模型的思考時間,使其成為一個強大的軟件工程AI,,在SWE-bench上創(chuàng)下了70.3%的高分,。
與此同時,,Anthropic還推出了首款智能體編程工具Claude Code(預(yù)覽版)。該工具已成為Anthropic內(nèi)部不可或缺的一部分,,在早期測試中,,Claude一次性完成了通常需要45分鐘的任務(wù),。這意味著產(chǎn)品經(jīng)理可以利用AI來編寫代碼。
雖然沒有發(fā)布Claude 4,但Anthropic這一舉動再次震撼了AI界,。最近半個月,,Grok 3剛剛發(fā)布,DeepSeek連續(xù)開源五天,,OpenAI GPT-4.5也即將上線,,再加上Claude 3.7 Sonnet,大模型領(lǐng)域的競爭愈發(fā)激烈,。
Claude 3.7 Sonnet是市場上首個混合推理模型,,能夠即時響應(yīng)或逐步展示詳細(xì)的思考步驟,。API用戶還可以精細(xì)控制模型的思考時間。在編碼和前端網(wǎng)頁開發(fā)方面,,Claude 3.7 Sonnet得到了顯著提升,。此外,Claude Code作為命令行工具,,使開發(fā)人員能夠直接從終端將大量工程任務(wù)委托給Claude,。
Claude 3.7 Sonnet的設(shè)計理念與眾不同,Anthropic認(rèn)為推理應(yīng)是前沿模型的整體能力,,而不是獨立的模型,。用戶可以選擇在何時希望模型正常回答,,何時希望它在回答前進(jìn)行更長時間的思考,。通過API使用時,用戶還可以控制思考的預(yù)算,,最多可達(dá)128K tokens,,從而在速度和成本之間找到平衡。
Claude 3.7 Sonnet在多個基準(zhǔn)測試中表現(xiàn)出色,特別是在SWE-bench Verified和TAU-bench上刷新了SOTA記錄,。盡管在某些方面略遜于Grok 3 Beta,,但在多模態(tài)能力和自主編程方面表現(xiàn)突出,甚至在寶可夢游戲測試中超越了所有先前模型。
自2024年6月以來,Sonnet系列一直是全球開發(fā)者的首選模型,。Claude Code主動與人協(xié)作,,能夠搜索和閱讀代碼、編輯文件,、編寫和運行測試,、提交并將代碼推送至GitHub,同時確保用戶在每一步都能參與其中,。此外,,所有Claude套餐都支持GitHub集成,開發(fā)者可以直接連接代碼倉庫到Claude,。
Claude 3.7 Sonnet具備一項新特性——行為擴展,,使其能夠迭代調(diào)用函數(shù),、響應(yīng)環(huán)境變化,并持續(xù)操作直到完成開放式任務(wù),。這一進(jìn)步在OSWorld評估中得到了充分體現(xiàn),,尤其是在玩口袋妖怪游戲中,Claude 3.7 Sonnet成功挑戰(zhàn)并擊敗了三位道館館主,,獲得了相應(yīng)的徽章,。
Claude 3.7 Sonnet還利用串行和并行測試時計算機制,,通過采樣多個獨立的思維過程并選擇最佳結(jié)果,顯著提升了其性能,。這些優(yōu)化策略已在多個AI模型的評估報告中得到驗證,。
Claude 3.7 Sonnet和Claude Code標(biāo)志著向真正增強人類能力的人工智能系統(tǒng)邁出的重要一步,。它們具備深入推理、自主工作和有效協(xié)作的能力,,使我們更接近一個未來,,在那里人工智能豐富了人類所能實現(xiàn)的事情。目前,,Claude 3.7 Sonnet已經(jīng)在Claude.ai平臺上線,,Web,、iOS和Android用戶皆可免費體驗。對于希望構(gòu)建自定義AI解決方案的開發(fā)者,,可以通過Anthropic API,、Amazon Bedrock以及Google Cloud的Vertex AI進(jìn)行訪問。
巴黎奧運會的落幕并未讓奧運激情消散,特別是92年出生的克里斯汀-??思{(Kristen Faulkner)的故事格外引人注目
2024-08-13 15:28:2332歲女投資人