全球首個(gè)混合推理模型Claude 3.7降世,!Anthropic終于發(fā)布了其首款混合推理模型Claude 3.7 Sonnet,,這是迄今為止最智能的Claude系列模型。它能夠及時(shí)響應(yīng),,并進(jìn)行可擴(kuò)展的逐步思考,。簡(jiǎn)單來(lái)說(shuō),這個(gè)模型具備兩種思考方式,。
例如,,用戶可以將一個(gè)復(fù)雜的數(shù)學(xué)問(wèn)題如蒙提霍爾問(wèn)題交給Claude 3.7 Sonnet,并選擇“擴(kuò)展”模式,。在這種模式下,,Claude 3.7 Sonnet會(huì)展示詳細(xì)的思維過(guò)程,并在52秒內(nèi)完成解答,。目前,,所有人都可以免費(fèi)使用Claude 3.7 Sonnet,但“擴(kuò)展思考”模式尚未上線,。
在多項(xiàng)基準(zhǔn)測(cè)試中,,Claude 3.7 Sonnet在數(shù)學(xué)、物理,、指令執(zhí)行和編程等方面刷新了SOTA記錄,。與上一代Claude 3.5相比,其數(shù)學(xué)和編碼能力提升了10%以上,。除了數(shù)學(xué)領(lǐng)域,,Claude 3.7 Sonnet(64k擴(kuò)展思考)幾乎完全碾壓o3-mini和DeepSeek R1,在某些方面甚至與Grok 3不相上下,。API用戶可以精確控制模型的思考時(shí)間,,使其成為一個(gè)強(qiáng)大的軟件工程AI,在SWE-bench上創(chuàng)下了70.3%的高分,。
與此同時(shí),,Anthropic還推出了首款智能體編程工具Claude Code(預(yù)覽版)。該工具已成為Anthropic內(nèi)部不可或缺的一部分,,在早期測(cè)試中,,Claude一次性完成了通常需要45分鐘的任務(wù),。這意味著產(chǎn)品經(jīng)理可以利用AI來(lái)編寫代碼。
雖然沒有發(fā)布Claude 4,,但Anthropic這一舉動(dòng)再次震撼了AI界,。最近半個(gè)月,Grok 3剛剛發(fā)布,,DeepSeek連續(xù)開源五天,,OpenAI GPT-4.5也即將上線,再加上Claude 3.7 Sonnet,,大模型領(lǐng)域的競(jìng)爭(zhēng)愈發(fā)激烈,。
Claude 3.7 Sonnet是市場(chǎng)上首個(gè)混合推理模型,能夠即時(shí)響應(yīng)或逐步展示詳細(xì)的思考步驟,。API用戶還可以精細(xì)控制模型的思考時(shí)間,。在編碼和前端網(wǎng)頁(yè)開發(fā)方面,Claude 3.7 Sonnet得到了顯著提升,。此外,,Claude Code作為命令行工具,使開發(fā)人員能夠直接從終端將大量工程任務(wù)委托給Claude,。