近期發(fā)生了一件有趣的事情,,關(guān)于一個(gè)看似簡(jiǎn)單的數(shù)學(xué)比較問(wèn)題,,卻讓不少高級(jí)人工智能模型遭遇了“滑鐵盧”。這個(gè)問(wèn)題是判斷9.11與9.8哪個(gè)數(shù)字更大。在7月17日的一次測(cè)試中,,共有13個(gè)當(dāng)前主流的人工智能模型接受了這個(gè)挑戰(zhàn)。測(cè)試結(jié)果顯示,,阿里通義千問(wèn),、百度文心一言、Minimax,、騰訊元寶,、科大訊飛星火以及智譜清言和百川智能的百小應(yīng)答對(duì)了這道題目。然而,,ChatGPT-4o,、字節(jié)豆包、月之暗面kimi,、零一萬(wàn)物萬(wàn)知,、階躍星辰躍問(wèn)及商湯商量則給出了錯(cuò)誤答案。
有意思的是,,有報(bào)道指出,,智譜清言和百川智能的百小應(yīng)在此前也遇到過(guò)類似的問(wèn)題并出過(guò)錯(cuò),但截止到最新消息,,這兩個(gè)模型已經(jīng)修正了那些錯(cuò)誤,。
至于如何在微信中探索更多功能,用戶只需簡(jiǎn)單地點(diǎn)擊界面底部的“發(fā)現(xiàn)”按鈕即可開(kāi)啟新的旅程,。