AI和姜萍答同一份卷結果如何？人類智慧暫勝一籌

小大

用微信掃描二維碼
分享至好友和朋友圈

關鍵詞：

2024-06-16 12:40:59 經濟觀察報

6月13日,，第六屆阿里巴巴全球數(shù)學競賽揭曉決賽名單,，亮點之一是17歲的江蘇漣水中等專業(yè)學校學生姜萍，她不僅成功躋身全球前30名,，更是該組別中唯一的女性選手,。

本屆競賽引入了新變化，首次增設AI大模型挑戰(zhàn)賽,，與姜萍等數(shù)萬名全球數(shù)學愛好者同臺競技的是563支由頂尖高校,、研究機構及企業(yè)組建的AI隊伍。盡管AI隊伍展現(xiàn)了一定水平,，平均分達到18分,，接近人類選手平均水平,，但最高分34分與人類最高分113分相距甚遠，無一支AI隊伍進入決賽,。

其中,，由上海建平中學學生涂津豪設計的AI方案憑借34分奪得AI挑戰(zhàn)賽冠軍。他采用自辯論策略,，讓大模型進行自我問答驗證,，優(yōu)化解題路徑。西南交通大學的特工宇宙團隊和中國人民大學的SuperCarryMan團隊則分別以27分獲得亞軍和季軍,，兩隊均利用多個智能體協(xié)作解題,，展現(xiàn)了不同的策略和方法。

浙江大學計算機系統(tǒng)結構實驗室的研究員陳天楚分析指出,，當前大語言模型在處理需要反復試錯和深入思考的數(shù)學問題時,，邏輯推理和嚴謹思考能力仍顯不足，尚不能與受過專業(yè)訓練的人類匹敵,。AI閱卷點評亦強調了AI在邏輯推理和證明題方面的局限性,。

一位來自互聯(lián)網企業(yè)的技術總監(jiān)對此表示高度關注，認為這次AI挑戰(zhàn)賽不僅是對模型能力的檢驗,，也是對AI深層邏輯推理及創(chuàng)新思維局限性的揭示,。盡管AI在特定任務上能超越人類，但在復雜邏輯和創(chuàng)新領域,，人類依然保持明顯優(yōu)勢,。

盡管AI隊伍未能在此次數(shù)學競賽中勝出人類，技術總監(jiān)認為這將促進對AI本質的深入理解,，并可能激發(fā)數(shù)學和AI技術的新發(fā)展,。今年，眾多AI隊伍嘗試了多種策略提升AI的數(shù)學能力,，預示著未來技術進步的無限可能,。

自2018年起，阿里巴巴全球數(shù)學競賽由阿里巴巴公益和達摩院聯(lián)合舉辦,，以其零門檻,、全民可參與的特點，至今已吸引全球25萬人次參與,，成為規(guī)模最大的在線數(shù)學競賽平臺,。

(責任編輯：張蕾)

關閉

AI和姜萍答同一份卷 結果如何？人類智慧暫勝一籌

相關新聞

今日熱點

頻道熱點

AI和姜萍答同一份卷結果如何？人類智慧暫勝一籌