563支AI隊伍和姜萍答了同一份試卷：最高34分,，無一入圍決賽 —— AI挑戰(zhàn)人類智慧邊界

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2024-06-16 12:34:19 齊魯壹點

在最近結(jié)束的第六屆阿里巴巴全球數(shù)學(xué)競賽中，17歲的江蘇漣水中學(xué)學(xué)生姜萍脫穎而出,，她在全球數(shù)萬名參賽者中排名12,，不僅成為了決賽圈的焦點，也是30強(qiáng)中唯一的女性選手,。此次競賽的一大亮點是首次引入了AI大模型挑戰(zhàn)賽,，吸引了563支由全球頂尖學(xué)術(shù)機(jī)構(gòu)和企業(yè)組建的AI團(tuán)隊與人類選手同臺競技，共解同一套試題,。

4月13日,，隨著競賽的鐘聲響起，數(shù)以萬計的數(shù)學(xué)愛好者在全球范圍內(nèi)開始了他們的智力征程,，試題涵蓋選擇題,、解答題及證明題等多種類型。然而,，盡管AI隊伍展現(xiàn)了一定的實力,，其平均分達(dá)到了18分，與人類選手持平,，最高分卻只有34分,，遠(yuǎn)不及人類選手的113分高峰，無一支AI隊伍進(jìn)入最終的801人決賽名單,。

值得關(guān)注的是,，上海建平中學(xué)的涂津豪憑借獨創(chuàng)的AI策略獲得了AI隊伍中的最高分，該策略靈感來源于自辯論思想,，通過大模型之間的多輪問答驗證來逼近問題的最佳解答,。而來自西南交通大學(xué)和中國人民大學(xué)的兩支AI隊伍,，則分別憑借獨特的Multi-Agent系統(tǒng)設(shè)計榮獲亞軍和季軍，展現(xiàn)了不同的解題思路與技術(shù)路徑,。

浙江大學(xué)計算機(jī)系統(tǒng)結(jié)構(gòu)實驗室的研究員陳天楚指出,，當(dāng)前大語言模型（LLM）在處理數(shù)學(xué)競賽這類需要反復(fù)試錯與深度思考的任務(wù)時,，仍面臨邏輯推理和嚴(yán)謹(jǐn)思考的局限性,，盡管已有通過Prompt工程提升模型表現(xiàn)的嘗試，但效果有限,，尚不能與人類專家相提并論,。

賽事組委會在點評中也強(qiáng)調(diào)了AI在邏輯推理和證明題方面的不足。一位互聯(lián)網(wǎng)企業(yè)的技術(shù)總監(jiān)認(rèn)為,，這次AI挑戰(zhàn)賽不僅是對“百模大戰(zhàn)”后AI模型能力的檢驗,，更是凸顯了在復(fù)雜邏輯推理和創(chuàng)新思維領(lǐng)域，人類選手依然保持明顯優(yōu)勢,。

盡管AI在本次數(shù)學(xué)競賽中的表現(xiàn)未能超越人類,，但這場較量被視作推動人工智能與數(shù)學(xué)理論發(fā)展的重要契機(jī)。今年,，各支AI隊伍通過多種技術(shù)創(chuàng)新探索提升AI數(shù)學(xué)能力的新途徑,，預(yù)示著未來人工智能與數(shù)學(xué)領(lǐng)域的互動將更加深入。

阿里巴巴全球數(shù)學(xué)競賽自2018年創(chuàng)辦以來,，以其開放的參賽門檻和廣泛的參與度,，吸引了全球超過25萬人次參與，成為全球最大的在線數(shù)學(xué)競賽平臺之一,，持續(xù)激發(fā)著全球數(shù)學(xué)愛好者的熱情與創(chuàng)造力,。

(責(zé)任編輯：張蕾)

關(guān)閉

563支AI隊伍和姜萍答了同一份試卷：最高34分,，無一入圍決賽 —— AI挑戰(zhàn)人類智慧邊界

相關(guān)新聞

今日熱點

頻道熱點