AI水平超过数学奥赛金牌得主。谷歌昨日宣布,其子公司DeepMind开发的最新AI系统AlphaGeometry2在国际数学奥林匹克竞赛(IMO)的大规模几何题目测试中,首次超越了人类金牌得主的水平。研究团队从2000年至2024年的IMO竞赛中精选了45道几何题目,并转化为50道标准题目。测试结果显示,AlphaGeometry2成功解答了其中的42道题目,超过了金牌得主平均40.9分的成绩。
这一突破意义深远,因为解决具有挑战性的几何问题所需的推理能力和策略选择能力是构建下一代通用人工智能的关键要素。网友对此表示高度赞赏,称其“接近完美”。
DeepMind对高中数学竞赛的重视源于一个深层洞察:解决欧几里得几何问题的能力可能是构建更强大AI系统的关键。证明数学定理需要同时具备推理能力和在多个可能步骤中做出选择的能力,这些技能将成为未来通用AI模型的重要组成部分。事实上,在2024年夏天的一次演示中,DeepMind将AlphaGeometry2与数学形式推理AI模型AlphaProof结合,成功解决了当年IMO竞赛6道题目中的4道。
技术架构方面,AlphaGeometry2采用了一种混合方案,结合了谷歌Gemini系列的语言模型和专门的符号运算引擎。解题过程中,Gemini模型负责预测解题可能需要的几何构造,而符号引擎则基于严格的数学规则进行推导。两个模块通过并行搜索算法协同工作,将发现的有用信息存储在共享知识库中。当系统能够将Gemini模型的建议与符号引擎的已知原理结合,得出完整证明时,即认为完成了问题求解。
为克服几何训练数据匮乏的问题,研究团队自主生成了超过3亿个不同复杂度的定理和证明用于训练。这种大规模的合成数据训练方法为AI在特定领域实现突破提供了新的范例。尽管如此,AlphaGeometry2仍存在明显局限,无法处理包含可变点数、非线性方程和不等式的问题。在更具挑战性的29道IMO候选题中,系统仅能解决20道。
一种名为PatternBoost的新方法在数学问题中寻找有趣的结构,这种方法结合了局部搜索和全局搜索
2024-11-14 16:07:30Transformer打破三十年数学猜想随着投资者对人工智能长期增长前景持续看好,英伟达的市值在周二超过了苹果,成为全球市值最高的公司。当天,英伟达股价上涨2.9%,达到139.93美元,对应市值为3.43万亿美元
2024-11-06 11:55:00英伟达市值再次超过苹果