Grok3翻車了 回答9.11比9.9大 最聰明AI的尷尬時(shí)刻。近日,,馬斯克與xAI團(tuán)隊(duì)在直播中正式發(fā)布了最新版本的Grok3,。此前,馬斯克曾稱Grok-3為“地球上最聰明的AI”,,并在X平臺(tái)上表示自己整個(gè)周末都在和團(tuán)隊(duì)打磨產(chǎn)品,。
然而,有媒體報(bào)道稱,,有人測試了最新的Beta版Grok3,,并提出了那個(gè)經(jīng)典的用來刁難大模型的問題:“9.11與9.9哪個(gè)大?”遺憾的是,,號(hào)稱目前最聰明的Grok3,,在不加任何定語及標(biāo)注的情況下,仍然無法正確回答這個(gè)問題,。相比之下,,用同樣的問題詢問DeepSeek時(shí),無論是否開啟深度思考模式,,對方都給出了正確的答案:9.9大于9.11,。
“9.11和9.9哪個(gè)大”是AI領(lǐng)域的一個(gè)經(jīng)典問題。艾倫研究機(jī)構(gòu)成員林禹臣曾在社交媒體上發(fā)布的截圖顯示,,ChatGPT-4o認(rèn)為13.11比13.8更大,。他表示,雖然AI越來越擅長做數(shù)學(xué)奧賽題,,但常識(shí)依舊很難,。隨后,Scale AI的提示工程師萊利·古德賽德基于此靈感變換了問法,,拷問了當(dāng)時(shí)最強(qiáng)的大模型ChatGPT-4o,、谷歌Gemini Advanced以及Claude 3.5 Sonnet——9.11和9.9哪個(gè)更大?這些主流大模型通通答錯(cuò),,他也成功將此話題傳播開來,。
Grok-3發(fā)布會(huì)的背景板上寫著“我們的使命是了解宇宙”。馬斯克曾表示,,xAI公司的目標(biāo)就是“了解宇宙”,。一周前,馬斯克在直播中評(píng)論DeepSeek R1時(shí),,曾信心滿滿地表示“xAI即將推出更優(yōu)秀的AI模型”,。從現(xiàn)場展示的數(shù)據(jù)來看,,Grok3在數(shù)學(xué)、科學(xué)與編程的基準(zhǔn)測試上已經(jīng)超越了目前所有的主流模型,,馬斯克甚至宣稱Grok 3未來將用于SpaceX火星任務(wù)計(jì)算,,并預(yù)測“三年內(nèi)將實(shí)現(xiàn)諾貝爾獎(jiǎng)級(jí)別突破”。
她拼命解釋為什么抹黑中國有利于美國,,卻翻了大車,,外國網(wǎng)友直言:收錢來黑中國有什么可信度,?倒是進(jìn)一步證明了USAID就是美國中情局等干涉、顛覆別國的一環(huán)
2025-02-09 11:32:14這個(gè)反華分子翻車了山姆會(huì)員店近期頻繁成為公眾焦點(diǎn),,其一款弱堿性礦泉水在網(wǎng)絡(luò)傳言中被誤稱為“生仔水”,意外引發(fā)搶購熱潮,,甚至一度限購
2024-09-10 20:28:10狂飆的山姆近日,“行走的百科全書”董宇輝在直播中聊的話題,,越來越讓人聽不懂了,。先有“不要妖魔化食品添加劑”,后有“居里夫人發(fā)現(xiàn)了鈾,,還發(fā)明了X光機(jī)”,。
2024-09-30 14:47:42董宇輝糾正科普錯(cuò)誤