AI水平超過數(shù)學(xué)奧賽金牌得主,。谷歌昨日宣布,,其子公司DeepMind開發(fā)的最新AI系統(tǒng)AlphaGeometry2在國際數(shù)學(xué)奧林匹克競賽(IMO)的大規(guī)模幾何題目測試中,首次超越了人類金牌得主的水平,。研究團(tuán)隊(duì)從2000年至2024年的IMO競賽中精選了45道幾何題目,,并轉(zhuǎn)化為50道標(biāo)準(zhǔn)題目。測試結(jié)果顯示,,AlphaGeometry2成功解答了其中的42道題目,,超過了金牌得主平均40.9分的成績。
這一突破意義深遠(yuǎn),,因?yàn)榻鉀Q具有挑戰(zhàn)性的幾何問題所需的推理能力和策略選擇能力是構(gòu)建下一代通用人工智能的關(guān)鍵要素,。網(wǎng)友對此表示高度贊賞,稱其“接近完美”,。
DeepMind對高中數(shù)學(xué)競賽的重視源于一個深層洞察:解決歐幾里得幾何問題的能力可能是構(gòu)建更強(qiáng)大AI系統(tǒng)的關(guān)鍵,。證明數(shù)學(xué)定理需要同時具備推理能力和在多個可能步驟中做出選擇的能力,這些技能將成為未來通用AI模型的重要組成部分,。事實(shí)上,,在2024年夏天的一次演示中,DeepMind將AlphaGeometry2與數(shù)學(xué)形式推理AI模型AlphaProof結(jié)合,,成功解決了當(dāng)年IMO競賽6道題目中的4道,。
技術(shù)架構(gòu)方面,AlphaGeometry2采用了一種混合方案,,結(jié)合了谷歌Gemini系列的語言模型和專門的符號運(yùn)算引擎,。解題過程中,Gemini模型負(fù)責(zé)預(yù)測解題可能需要的幾何構(gòu)造,,而符號引擎則基于嚴(yán)格的數(shù)學(xué)規(guī)則進(jìn)行推導(dǎo),。兩個模塊通過并行搜索算法協(xié)同工作,將發(fā)現(xiàn)的有用信息存儲在共享知識庫中,。當(dāng)系統(tǒng)能夠?qū)emini模型的建議與符號引擎的已知原理結(jié)合,,得出完整證明時,,即認(rèn)為完成了問題求解。
一種名為PatternBoost的新方法在數(shù)學(xué)問題中尋找有趣的結(jié)構(gòu),這種方法結(jié)合了局部搜索和全局搜索
2024-11-14 16:07:30Transformer打破三十年數(shù)學(xué)猜想