馬斯克宣布Grok4發(fā)布超越人類推理能力

小大

用微信掃描二維碼
分享至好友和朋友圈

關鍵詞：

2025-07-10 14:26:43 機器之心Pro

馬斯克宣布Grok4發(fā)布超越人類推理能力,！xAI終于發(fā)布了下一代大模型Grok 4,，其能力超乎想象,。北京時間今天中午12點左右,，馬斯克在直播中表示這是世界上最好的AI,，并展示了其強大功能,。

馬斯克宣布Grok4發(fā)布

Grok 4無需事先查看題目就能在SAT考試中獲得滿分,，GRE任何學科也能接近滿分,，超過了所有研究生的水平,。馬斯克認為Grok 4可以實現(xiàn)科學新發(fā)現(xiàn),。由于計算能力和強化學習的提升，Grok 4的推理能力比前代提升了10倍,。從Grok 2到Grok 4的技術范式不斷升級,，包括下一個token預測、預訓練計算,、預訓練+RL和RL計算,。

馬斯克宣布Grok4發(fā)布超越人類推理能力

Grok 4還增強了調(diào)用工具的能力，在各類高難度Benchmark上表現(xiàn)遠超SOTA,。在HLE（人類最后的考試）中,，Grok 4使用工具后的成績?yōu)?8.6%，而Grok 4 Heavy的成績達到了44.4%,。如果讓大模型花費更多時間思考并適當使用外部工具,，HLE分數(shù)能進一步提升到50.7%。此外，在GPQA,、AIME25,、LCB、HMMT25和USAMO25等基準測試中,，Grok 4 Heavy均取得了最新SOTA,。

馬斯克宣布Grok4發(fā)布超越人類推理能力

Grok 4已經(jīng)實現(xiàn)了博士后水平，在所有學科都能表現(xiàn)出色,。馬斯克多次強調(diào),，Grok將在今年內(nèi)實現(xiàn)新的科學技術發(fā)現(xiàn),。根據(jù)Artificial Analysis的評估,，Grok 4總成績達到了73分，領先于o3,、Gemini 2.5 Pro,、Claude 4 Opus和DeepSeek R1 0528。

馬斯克宣布Grok4發(fā)布超越人類推理能力

Grok 4不僅在語言基準測試中表現(xiàn)出色,，還在語音能力,、角色多樣性等方面得到了加強。語音速度快了2倍,，支持5種語音,，單日用戶總停留時長提升了10倍。新增的角色Eve和Sal已在iOS版Grok中可用,，其中Sal支持多種性格,，Eve可以唱歌和低語。

馬斯克宣布Grok4發(fā)布超越人類推理能力

在ARC-AGI基準測試中,，Grok 4取得了最新SOTA,，特別是在ARC-AGI-2上達到15.9%。在Vending-Bench基準測試中,，Grok 4也超越了其他模型,，顯示了其在真實物理世界中執(zhí)行復雜操作任務的能力。

馬斯克宣布Grok4發(fā)布超越人類推理能力

Grok 4可通過API調(diào)用,，提供256K tokens的上下文窗口,，現(xiàn)已開放使用。DannyLimanseta用Grok 4在4小時內(nèi)制作了一款FPS射擊游戲,，效果非常不錯,。接下來，xAI還將發(fā)布代碼模型,、多模態(tài)智能體以及視頻生成模型,。目前，Grok 4已經(jīng)上線，但需要付費使用,，價格較為昂貴,。年付SuperGrok為300美元，SuperGrok Heavy則為每年3000美元,。

馬斯克宣布Grok4發(fā)布超越人類推理能力

(責任編輯：0882)

關閉

馬斯克宣布Grok4發(fā)布 超越人類推理能力

相關新聞

今日熱點

頻道熱點

馬斯克宣布Grok4發(fā)布超越人類推理能力