為克服幾何訓練數(shù)據(jù)匱乏的問題,,研究團隊自主生成了超過3億個不同復雜度的定理和證明用于訓練,。這種大規(guī)模的合成數(shù)據(jù)訓練方法為AI在特定領(lǐng)域?qū)崿F(xiàn)突破提供了新的范例。盡管如此,,AlphaGeometry2仍存在明顯局限,,無法處理包含可變點數(shù),、非線性方程和不等式的問題。在更具挑戰(zhàn)性的29道IMO候選題中,,系統(tǒng)僅能解決20道,。
這一突破引發(fā)了對AI發(fā)展路徑的深入思考。傳統(tǒng)上,,AI領(lǐng)域存在兩種主要方法:基于符號操作的方法和類似人腦的神經(jīng)網(wǎng)絡(luò)方法,。AlphaGeometry2采用混合架構(gòu),其Gemini模型采用神經(jīng)網(wǎng)絡(luò)架構(gòu),,而符號引擎則基于規(guī)則運算,。根據(jù)Deepmind的論文,在測試中,,同樣采用神經(jīng)網(wǎng)絡(luò)架構(gòu)的OpenAI o1模型無法解決任何AlphaGeometry2成功解答的IMO問題,。
卡內(nèi)基梅隆大學AI專家Vince Conitzer指出,雖然在基準測試上取得了顯著進展,,但包括最新的“推理型”在內(nèi)的語言模型仍在一些簡單的常識問題上舉步維艱,。這表明我們?nèi)匀粺o法準確預測下一個系統(tǒng)的具體行為,考慮到這些系統(tǒng)可能產(chǎn)生的重大影響,,迫切需要更好地理解它們及其潛在風險,。
不過,研究團隊發(fā)現(xiàn)初步證據(jù)表明,,AlphaGeometry2的語言模型部分已顯示出無需符號引擎輔助也能生成部分解決方案的潛力,。但在模型運算速度得到根本改善、“幻覺”問題徹底解決之前,,符號運算等外部工具仍將在數(shù)學應用中扮演不可或缺的角色,。
一種名為PatternBoost的新方法在數(shù)學問題中尋找有趣的結(jié)構(gòu),這種方法結(jié)合了局部搜索和全局搜索
2024-11-14 16:07:30Transformer打破三十年數(shù)學猜想隨著投資者對人工智能長期增長前景持續(xù)看好,,英偉達的市值在周二超過了蘋果,成為全球市值最高的公司,。當天,,英偉達股價上漲2.9%,達到139.93美元,,對應市值為3.43萬億美元
2024-11-06 11:55:00英偉達市值再次超過蘋果