馬斯克宣布Grok4發(fā)布 超越人類推理能力,!xAI終于發(fā)布了下一代大模型Grok 4,其能力超乎想象,。北京時間今天中午12點左右,,馬斯克在直播中表示這是世界上最好的AI,并展示了其強大功能,。
Grok 4無需事先查看題目就能在SAT考試中獲得滿分,,GRE任何學科也能接近滿分,超過了所有研究生的水平,。馬斯克認為Grok 4可以實現科學新發(fā)現,。由于計算能力和強化學習的提升,Grok 4的推理能力比前代提升了10倍,。從Grok 2到Grok 4的技術范式不斷升級,,包括下一個token預測、預訓練計算,、預訓練+RL和RL計算,。
Grok 4還增強了調用工具的能力,在各類高難度Benchmark上表現遠超SOTA,。在HLE(人類最后的考試)中,,Grok 4使用工具后的成績?yōu)?8.6%,而Grok 4 Heavy的成績達到了44.4%,。如果讓大模型花費更多時間思考并適當使用外部工具,,HLE分數能進一步提升到50.7%,。此外,在GPQA,、AIME25,、LCB、HMMT25和USAMO25等基準測試中,,Grok 4 Heavy均取得了最新SOTA,。
Grok 4已經實現了博士后水平,在所有學科都能表現出色,。馬斯克多次強調,,Grok將在今年內實現新的科學技術發(fā)現。根據Artificial Analysis的評估,,Grok 4總成績達到了73分,,領先于o3、Gemini 2.5 Pro,、Claude 4 Opus和DeepSeek R1 0528,。
Grok 4不僅在語言基準測試中表現出色,還在語音能力,、角色多樣性等方面得到了加強,。語音速度快了2倍,支持5種語音,,單日用戶總停留時長提升了10倍,。新增的角色Eve和Sal已在iOS版Grok中可用,,其中Sal支持多種性格,,Eve可以唱歌和低語。
在ARC-AGI基準測試中,,Grok 4取得了最新SOTA,,特別是在ARC-AGI-2上達到15.9%。在Vending-Bench基準測試中,,Grok 4也超越了其他模型,,顯示了其在真實物理世界中執(zhí)行復雜操作任務的能力。
Grok 4可通過API調用,,提供256K tokens的上下文窗口,,現已開放使用。DannyLimanseta用Grok 4在4小時內制作了一款FPS射擊游戲,,效果非常不錯,。接下來,xAI還將發(fā)布代碼模型,、多模態(tài)智能體以及視頻生成模型,。目前,,Grok 4已經上線,但需要付費使用,,價格較為昂貴,。年付SuperGrok為300美元,SuperGrok Heavy則為每年3000美元,。
當地時間7月5日,,美國億萬富翁埃隆·馬斯克在社交媒體上發(fā)布消息:“今天,,‘美國黨’的成立還給你們自由?!瘪R斯克是在對他4日所發(fā)一條貼文的回復中作出上述表述的,。
2025-07-06 07:51:55馬斯克在社交媒體上宣布“美國黨”成立自2022年埃隆·馬斯克收購推特并將其更名為X以來,該平臺一直在努力拓展其功能和用戶群體,。曾經以公開分享觀點和制造熱點話題為主的X,,如今正朝著更加注重隱私和日常應用的方向發(fā)展
2025-06-02 10:36:18馬斯克宣布推出全新XChat