6月13日,,第六屆阿里巴巴全球數(shù)學競賽揭曉決賽名單,亮點之一是17歲的江蘇漣水中等專業(yè)學校學生姜萍,,她不僅成功躋身全球前30名,,更是該組別中唯一的女性選手。
本屆競賽引入了新變化,,首次增設AI大模型挑戰(zhàn)賽,,與姜萍等數(shù)萬名全球數(shù)學愛好者同臺競技的是563支由頂尖高校、研究機構(gòu)及企業(yè)組建的AI隊伍,。盡管AI隊伍展現(xiàn)了一定水平,,平均分達到18分,接近人類選手平均水平,,但最高分34分與人類最高分113分相距甚遠,,無一支AI隊伍進入決賽。
其中,,由上海建平中學學生涂津豪設計的AI方案憑借34分奪得AI挑戰(zhàn)賽冠軍,。他采用自辯論策略,讓大模型進行自我問答驗證,,優(yōu)化解題路徑,。西南交通大學的特工宇宙團隊和中國人民大學的SuperCarryMan團隊則分別以27分獲得亞軍和季軍,兩隊均利用多個智能體協(xié)作解題,,展現(xiàn)了不同的策略和方法,。
浙江大學計算機系統(tǒng)結(jié)構(gòu)實驗室的研究員陳天楚分析指出,當前大語言模型在處理需要反復試錯和深入思考的數(shù)學問題時,,邏輯推理和嚴謹思考能力仍顯不足,,尚不能與受過專業(yè)訓練的人類匹敵,。AI閱卷點評亦強調(diào)了AI在邏輯推理和證明題方面的局限性,。
一位來自互聯(lián)網(wǎng)企業(yè)的技術(shù)總監(jiān)對此表示高度關(guān)注,認為這次AI挑戰(zhàn)賽不僅是對模型能力的檢驗,,也是對AI深層邏輯推理及創(chuàng)新思維局限性的揭示,。盡管AI在特定任務上能超越人類,,但在復雜邏輯和創(chuàng)新領(lǐng)域,人類依然保持明顯優(yōu)勢,。
盡管AI隊伍未能在此次數(shù)學競賽中勝出人類,,技術(shù)總監(jiān)認為這將促進對AI本質(zhì)的深入理解,并可能激發(fā)數(shù)學和AI技術(shù)的新發(fā)展,。今年,,眾多AI隊伍嘗試了多種策略提升AI的數(shù)學能力,預示著未來技術(shù)進步的無限可能,。
自2018年起,,阿里巴巴全球數(shù)學競賽由阿里巴巴公益和達摩院聯(lián)合舉辦,以其零門檻,、全民可參與的特點,,至今已吸引全球25萬人次參與,成為規(guī)模最大的在線數(shù)學競賽平臺,。
在最近結(jié)束的第六屆阿里巴巴全球數(shù)學競賽中,,17歲的江蘇漣水中學學生姜萍脫穎而出,她在全球數(shù)萬名參賽者中排名12,,不僅成為了決賽圈的焦點,,也是30強中唯一的女性選手
2024-06-16 12:34:19563支AI隊伍和姜萍答了同一份試卷:最高34分成功入圍一全球數(shù)學競賽決賽的江蘇省漣水中等專業(yè)學校的姜萍,,一夜之間爆火,。
2024-06-14 11:37:35姜萍的夢想是浙大近期,上海人工智能實驗室的官方微博分享了一則消息:司南評測體系OpenCompass啟動了首次針對大模型的“語數(shù)外”高考全科目能力測評,,使用的是全國新課標I卷作為測試基準
2024-06-20 06:07:28首個AI高考全卷評測結(jié)果發(fā)布