AI水平超過數學奧賽金牌得主幾何推理新突破

小大

用微信掃描二維碼
分享至好友和朋友圈

關鍵詞：

2025-02-08 15:27:44 華爾街見聞

AI水平超過數學奧賽金牌得主。谷歌昨日宣布,，其子公司DeepMind開發(fā)的最新AI系統(tǒng)AlphaGeometry2在國際數學奧林匹克競賽(IMO)的大規(guī)模幾何題目測試中，首次超越了人類金牌得主的水平,。研究團隊從2000年至2024年的IMO競賽中精選了45道幾何題目,，并轉化為50道標準題目。測試結果顯示,，AlphaGeometry2成功解答了其中的42道題目,，超過了金牌得主平均40.9分的成績。

這一突破意義深遠,，因為解決具有挑戰(zhàn)性的幾何問題所需的推理能力和策略選擇能力是構建下一代通用人工智能的關鍵要素,。網友對此表示高度贊賞，稱其“接近完美”,。

DeepMind對高中數學競賽的重視源于一個深層洞察：解決歐幾里得幾何問題的能力可能是構建更強大AI系統(tǒng)的關鍵,。證明數學定理需要同時具備推理能力和在多個可能步驟中做出選擇的能力，這些技能將成為未來通用AI模型的重要組成部分,。事實上,，在2024年夏天的一次演示中，DeepMind將AlphaGeometry2與數學形式推理AI模型AlphaProof結合,，成功解決了當年IMO競賽6道題目中的4道,。

技術架構方面，AlphaGeometry2采用了一種混合方案,，結合了谷歌Gemini系列的語言模型和專門的符號運算引擎,。解題過程中，Gemini模型負責預測解題可能需要的幾何構造,，而符號引擎則基于嚴格的數學規(guī)則進行推導,。兩個模塊通過并行搜索算法協(xié)同工作，將發(fā)現的有用信息存儲在共享知識庫中,。當系統(tǒng)能夠將Gemini模型的建議與符號引擎的已知原理結合,，得出完整證明時，即認為完成了問題求解,。

為克服幾何訓練數據匱乏的問題，研究團隊自主生成了超過3億個不同復雜度的定理和證明用于訓練,。這種大規(guī)模的合成數據訓練方法為AI在特定領域實現突破提供了新的范例,。盡管如此，AlphaGeometry2仍存在明顯局限,，無法處理包含可變點數,、非線性方程和不等式的問題。在更具挑戰(zhàn)性的29道IMO候選題中,，系統(tǒng)僅能解決20道,。

12 全文共 2 頁下一頁

關閉

AI水平超過數學奧賽金牌得主 幾何推理新突破

相關新聞

今日熱點

頻道熱點

AI水平超過數學奧賽金牌得主幾何推理新突破