6月13日,第六屆阿里巴巴全球數(shù)學(xué)競賽揭曉決賽名單,,亮點(diǎn)之一是17歲的江蘇漣水中等專業(yè)學(xué)校學(xué)生姜萍,,她不僅成功躋身全球前30名,更是該組別中唯一的女性選手,。
本屆競賽引入了新變化,,首次增設(shè)AI大模型挑戰(zhàn)賽,與姜萍等數(shù)萬名全球數(shù)學(xué)愛好者同臺(tái)競技的是563支由頂尖高校,、研究機(jī)構(gòu)及企業(yè)組建的AI隊(duì)伍,。盡管AI隊(duì)伍展現(xiàn)了一定水平,平均分達(dá)到18分,,接近人類選手平均水平,,但最高分34分與人類最高分113分相距甚遠(yuǎn),無一支AI隊(duì)伍進(jìn)入決賽,。
其中,,由上海建平中學(xué)學(xué)生涂津豪設(shè)計(jì)的AI方案憑借34分奪得AI挑戰(zhàn)賽冠軍。他采用自辯論策略,,讓大模型進(jìn)行自我問答驗(yàn)證,,優(yōu)化解題路徑。西南交通大學(xué)的特工宇宙團(tuán)隊(duì)和中國人民大學(xué)的SuperCarryMan團(tuán)隊(duì)則分別以27分獲得亞軍和季軍,,兩隊(duì)均利用多個(gè)智能體協(xié)作解題,,展現(xiàn)了不同的策略和方法。
浙江大學(xué)計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)實(shí)驗(yàn)室的研究員陳天楚分析指出,,當(dāng)前大語言模型在處理需要反復(fù)試錯(cuò)和深入思考的數(shù)學(xué)問題時(shí),,邏輯推理和嚴(yán)謹(jǐn)思考能力仍顯不足,尚不能與受過專業(yè)訓(xùn)練的人類匹敵,。AI閱卷點(diǎn)評(píng)亦強(qiáng)調(diào)了AI在邏輯推理和證明題方面的局限性,。
一位來自互聯(lián)網(wǎng)企業(yè)的技術(shù)總監(jiān)對(duì)此表示高度關(guān)注,認(rèn)為這次AI挑戰(zhàn)賽不僅是對(duì)模型能力的檢驗(yàn),,也是對(duì)AI深層邏輯推理及創(chuàng)新思維局限性的揭示,。盡管AI在特定任務(wù)上能超越人類,,但在復(fù)雜邏輯和創(chuàng)新領(lǐng)域,人類依然保持明顯優(yōu)勢,。
盡管AI隊(duì)伍未能在此次數(shù)學(xué)競賽中勝出人類,,技術(shù)總監(jiān)認(rèn)為這將促進(jìn)對(duì)AI本質(zhì)的深入理解,并可能激發(fā)數(shù)學(xué)和AI技術(shù)的新發(fā)展,。今年,,眾多AI隊(duì)伍嘗試了多種策略提升AI的數(shù)學(xué)能力,預(yù)示著未來技術(shù)進(jìn)步的無限可能,。
自2018年起,,阿里巴巴全球數(shù)學(xué)競賽由阿里巴巴公益和達(dá)摩院聯(lián)合舉辦,以其零門檻,、全民可參與的特點(diǎn),,至今已吸引全球25萬人次參與,成為規(guī)模最大的在線數(shù)學(xué)競賽平臺(tái),。
成功入圍一全球數(shù)學(xué)競賽決賽的江蘇省漣水中等專業(yè)學(xué)校的姜萍,,一夜之間爆火,。
2024-06-14 11:37:35姜萍的夢想是浙大