Grok3翻車了回答9.11比9.9大最聰明AI的尷尬時(shí)刻

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-02-19 14:49:40 百家號(hào)

Grok3翻車了回答9.11比9.9大最聰明AI的尷尬時(shí)刻,。近日,，馬斯克與xAI團(tuán)隊(duì)在直播中正式發(fā)布了最新版本的Grok3,。此前，馬斯克曾稱Grok-3為“地球上最聰明的AI”,，并在X平臺(tái)上表示自己整個(gè)周末都在和團(tuán)隊(duì)打磨產(chǎn)品,。

然而,，有媒體報(bào)道稱，有人測(cè)試了最新的Beta版Grok3,，并提出了那個(gè)經(jīng)典的用來(lái)刁難大模型的問(wèn)題：“9.11與9.9哪個(gè)大,？”遺憾的是，號(hào)稱目前最聰明的Grok3,，在不加任何定語(yǔ)及標(biāo)注的情況下,，仍然無(wú)法正確回答這個(gè)問(wèn)題。相比之下,，用同樣的問(wèn)題詢問(wèn)DeepSeek時(shí),，無(wú)論是否開(kāi)啟深度思考模式,，對(duì)方都給出了正確的答案：9.9大于9.11。

“9.11和9.9哪個(gè)大”是AI領(lǐng)域的一個(gè)經(jīng)典問(wèn)題,。艾倫研究機(jī)構(gòu)成員林禹臣曾在社交媒體上發(fā)布的截圖顯示,，ChatGPT-4o認(rèn)為13.11比13.8更大。他表示,，雖然AI越來(lái)越擅長(zhǎng)做數(shù)學(xué)奧賽題,，但常識(shí)依舊很難。隨后,，Scale AI的提示工程師萊利·古德賽德基于此靈感變換了問(wèn)法,，拷問(wèn)了當(dāng)時(shí)最強(qiáng)的大模型ChatGPT-4o、谷歌Gemini Advanced以及Claude 3.5 Sonnet——9.11和9.9哪個(gè)更大,？這些主流大模型通通答錯(cuò),，他也成功將此話題傳播開(kāi)來(lái)。

Grok-3發(fā)布會(huì)的背景板上寫著“我們的使命是了解宇宙”,。馬斯克曾表示,，xAI公司的目標(biāo)就是“了解宇宙”。一周前,，馬斯克在直播中評(píng)論DeepSeek R1時(shí),，曾信心滿滿地表示“xAI即將推出更優(yōu)秀的AI模型”。從現(xiàn)場(chǎng)展示的數(shù)據(jù)來(lái)看,，Grok3在數(shù)學(xué),、科學(xué)與編程的基準(zhǔn)測(cè)試上已經(jīng)超越了目前所有的主流模型，馬斯克甚至宣稱Grok 3未來(lái)將用于SpaceX火星任務(wù)計(jì)算,，并預(yù)測(cè)“三年內(nèi)將實(shí)現(xiàn)諾貝爾獎(jiǎng)級(jí)別突破”,。

馬斯克強(qiáng)調(diào)，Grok-3可以減少AI幻覺(jué),，方法是通過(guò)來(lái)回檢查數(shù)據(jù)并嘗試實(shí)現(xiàn)邏輯一致性,。他還透露，訓(xùn)練Grok-3所使用的算力遠(yuǎn)多于此前的版本,，并使用了大量合成數(shù)據(jù),。不同于DeepSeek的算法優(yōu)化路徑,，xAI透露,，Grok-3的開(kāi)發(fā)得益于用8個(gè)月時(shí)間建成的Colossus超級(jí)計(jì)算機(jī)，它由10萬(wàn)個(gè)英偉達(dá)的H100 GPU驅(qū)動(dòng),，為訓(xùn)練提供了2億個(gè)GPU小時(shí),，比Grok-2多十多倍。

xAI還宣布推出名為Deepsearch的Grok-3智能搜索引擎,，名字和Deepseek頗為相似,。

(責(zé)任編輯：盧其龍 CN070)

關(guān)閉

Grok3翻車了 回答9.11比9.9大 最聰明AI的尷尬時(shí)刻

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

Grok3翻車了回答9.11比9.9大最聰明AI的尷尬時(shí)刻