注册登录

中华网 china.com

新闻

国内国际社会体育专题军事财经滚动政务冬奥

AI水平超过数学奥赛金牌得主几何推理新突破

小大

用微信扫描二维码
分享至好友和朋友圈

关键词：

2025-02-08 15:27:44 华尔街见闻

AI水平超过数学奥赛金牌得主。谷歌昨日宣布，其子公司DeepMind开发的最新AI系统AlphaGeometry2在国际数学奥林匹克竞赛(IMO)的大规模几何题目测试中，首次超越了人类金牌得主的水平。研究团队从2000年至2024年的IMO竞赛中精选了45道几何题目，并转化为50道标准题目。测试结果显示，AlphaGeometry2成功解答了其中的42道题目，超过了金牌得主平均40.9分的成绩。

这一突破意义深远，因为解决具有挑战性的几何问题所需的推理能力和策略选择能力是构建下一代通用人工智能的关键要素。网友对此表示高度赞赏，称其“接近完美”。

DeepMind对高中数学竞赛的重视源于一个深层洞察：解决欧几里得几何问题的能力可能是构建更强大AI系统的关键。证明数学定理需要同时具备推理能力和在多个可能步骤中做出选择的能力，这些技能将成为未来通用AI模型的重要组成部分。事实上，在2024年夏天的一次演示中，DeepMind将AlphaGeometry2与数学形式推理AI模型AlphaProof结合，成功解决了当年IMO竞赛6道题目中的4道。

技术架构方面，AlphaGeometry2采用了一种混合方案，结合了谷歌Gemini系列的语言模型和专门的符号运算引擎。解题过程中，Gemini模型负责预测解题可能需要的几何构造，而符号引擎则基于严格的数学规则进行推导。两个模块通过并行搜索算法协同工作，将发现的有用信息存储在共享知识库中。当系统能够将Gemini模型的建议与符号引擎的已知原理结合，得出完整证明时，即认为完成了问题求解。

为克服几何训练数据匮乏的问题，研究团队自主生成了超过3亿个不同复杂度的定理和证明用于训练。这种大规模的合成数据训练方法为AI在特定领域实现突破提供了新的范例。尽管如此，AlphaGeometry2仍存在明显局限，无法处理包含可变点数、非线性方程和不等式的问题。在更具挑战性的29道IMO候选题中，系统仅能解决20道。

12 全文共 2 页下一页

关闭

方大同从没放弃治疗！新专辑制作人晒聊天记录称他去世前一周，仍在接受治疗音乐至生命最后一刻

方大同从没放弃治疗,新专辑制作人晒聊天记录称他去世前一周,仍在接受治疗2025-03-04 12:09:04

加拿大拟对美商品征收25%关税反击措施已备

加拿大拟对美商品征收25%关税2025-03-04 12:07:29

超三成体检人群面临听力损失耳机使用需谨慎

超三成体检人群面临听力损失2025-03-04 12:07:06

俄罗斯回应日本制裁对等反制措施出台

俄罗斯回应日本制裁2025-03-04 11:28:48

克宫回应美乌总统争吵：普京已知悉这一“前所未有的事件” 全球公众关注白宫风波

克宫回应美乌总统争吵,普京已知悉这一前所未有的事件2025-03-04 11:15:32

雷军：建议优化新能源汽车号牌设计提升外观兼容性与智能化

雷军,建议优化新能源汽车号牌设计2025-03-04 11:59:33

加拿大拟对美商品征收25%关税反击措施已备

加拿大拟对美商品征收25%关税2025-03-04 12:07:29

台积电计划在美追加1000亿美元投资扩产芯片制造产能加速全球半导体格局重塑

台积电计划在美追加1000亿美元投资扩产芯片制造产能2025-03-04 11:42:01

我国取得量子计算机领域新突破祖冲之三号超越谷歌成果

我国取得量子计算机领域新突破2025-03-04 11:59:52

超三成体检人群面临听力损失耳机使用需谨慎

超三成体检人群面临听力损失2025-03-04 12:07:06

泽连斯基：要换掉我不容易的所以必须与我谈判美乌关系面临考验

泽连斯基,要换掉我不容易的所以必须与我谈判2025-03-04 10:42:04

特朗普泽连斯基矛盾再度升级白宫争吵后局势恶化

特朗普泽连斯基矛盾再度升级2025-03-04 10:40:36

台积电拟在美追加投资1000亿美元扩大半导体制造布局

台积电拟在美追加投资1000亿美元2025-03-04 11:57:54

美国向我国返还41件文物艺术品珍贵文物回家

美国向我国返还41件文物艺术品2025-03-04 12:00:48

牛弹琴：特朗普对欧发出最轻蔑一问

牛弹琴：特朗普对欧发出最轻蔑一问2025-03-04 10:54:22

卡迪西亚力压胜利排沙特联第3 升班马表现抢眼

卡迪西亚力压胜利排沙特联第32025-03-04 11:52:54

3月开门黑！华尔街彻底慌了：年内得降三次息？股市抛售狂潮来袭

3月开门黑,华尔街彻底慌了,年内得降三次息2025-03-04 12:03:56

特朗普和泽连斯基谁是真正的“胆小鬼”？外交博弈的极限挑战

特朗普和泽连斯基谁是真正的胆小鬼2025-03-04 11:40:36

美国一参议员呼吁泽连斯基辞职泽连斯基强硬回应

美国一参议员呼吁泽连斯基辞职2025-03-04 10:28:52

泽连斯基说乌克兰需要和平安全保障是关键

泽连斯基说乌克兰需要和平2025-03-04 10:40:52

比特币再跌8%！特朗普储备承诺也难抵消市场悲观情绪宏观因素主导下跌

比特币再跌8%,特朗普储备承诺也难抵消市场悲观情绪2025-03-04 10:42:23

伊朗总统支持与美对话遭哈梅内伊反对 “那就不谈” 最高领袖定方向

伊朗总统支持与美对话遭哈梅内伊反对那就不谈2025-03-04 11:41:40

医生建议睡觉时别戴耳机保护听力健康

医生建议睡觉时别戴耳机2025-03-04 12:00:25

代表谈如何看待大学广泛开设AI课推动审慎探索与应用

代表谈如何看待大学广泛开设AI课2025-03-04 11:54:17

雷军回应双Ultra海外首秀展现湖北创新力

雷军回应双Ultra海外首秀2025-03-04 12:05:58

仅剩8天，弹劾案奏响终曲，尹锡悦摇摇欲坠结局即将揭晓

仅剩8天,弹劾案奏响终曲,尹锡悦摇摇欲坠2025-03-04 10:28:34

读懂中国扩大高水平对外开放的决心 RCEP成效显著

读懂中国扩大高水平对外开放的决心2025-03-04 11:56:04

贝索斯发火箭把未婚妻送上太空全女性团队创举引发热议

贝索斯发火箭把未婚妻送上太空2025-03-04 10:30:17

中国运动员“终身保单”：最高月领6000元，樊振东等成首批受益人社会力量助力体育保障

中国运动员终身保单,最高月领6000元,樊振东等成首批受益人2025-03-04 12:04:14

白宫称除非泽连斯基当众道歉否则免谈拒绝道歉推动对话

白宫称除非泽连斯基当众道歉否则免谈2025-03-04 11:28:15

日民间团体要求政府彻查驻日美军基地，追责有机氟污染问题

日民间团体要求政府彻查驻日美军基地2025-03-04 10:50:59

美国欲全面禁止对华出口AI芯片：英伟达股价狂跌一夜蒸发1.9万亿元

美国欲全面禁止对华出口AI芯片,英伟达股价狂跌一夜蒸发1,9万亿元2025-03-04 11:40:20

方大同从没放弃治疗！新专辑制作人晒聊天记录称他去世前一周，仍在接受治疗音乐至生命最后一刻

方大同从没放弃治疗,新专辑制作人晒聊天记录称他去世前一周,仍在接受治疗2025-03-04 12:09:04

三国脚级外援加盟长春女足非洲强援助力新赛季

三国脚级外援加盟长春女足2025-03-04 11:54:48

小米15系列磁吸外接摄像头解析重新定义手机摄影边界

小米15系列磁吸外接摄像头解析2025-03-04 12:04:37

相关新闻

浙江8名学子保送清华北大数学奥赛国集队成员
2024年全国中学生数学奥林匹克竞赛（决赛）闭幕，获奖名单公布。重庆队获得团体第一名，来自上海市上海中学的邓乐言获得个人第一名，并取得唯一满分。本次比赛决出金牌218人，银牌316人，铜牌179人。其中最受关注的是国家集训队名单
2024-12-02 13:49:04浙江8名学子保送清华北大
Transformer打破三十年数学猜想，Meta研究者用AI给出反例，算法杀手攻克数学难题！
一种名为PatternBoost的新方法在数学问题中寻找有趣的结构，这种方法结合了局部搜索和全局搜索
2024-11-14 16:07:30Transformer打破三十年数学猜想
微软AI助手加入办公软件套装提升生产力工具智能水平
科技巨头微软正致力于增加AI带来的收入。1月16日，微软宣布其AI助手Copilot和新的图像编辑工具Microsoft Designer将加入办公应用套组Microsoft 365个人版和家庭版订阅计划
2025-01-20 09:13:24微软AI助手加入办公软件套装
女性向下婚的夫妻生育水平较低接受高等教育比例已超过配偶
女性受教育程度提升和性别地位的演变，正在重塑婚育结构。教育性别差距的逆转，已经引发婚姻市场的深刻变革。华东师范大学社会发展学院教授卿石松基于妻子出生于1950—1994年的12523对夫妻样本，分析了夫妻教育匹配模式的变化及其对生育行为的影响。
2024-10-24 11:31:29女性接受高等教育比例已超过配偶
英伟达市值再次超过苹果 AI前景乐观推动
随着投资者对人工智能长期增长前景持续看好，英伟达的市值在周二超过了苹果，成为全球市值最高的公司。当天，英伟达股价上涨2.9%，达到139.93美元，对应市值为3.43万亿美元
2024-11-06 11:55:00英伟达市值再次超过苹果
近期流感未超过上一年流行季水平医疗资源尚充足
国家卫生健康委医疗应急司副司长高新强在1月12日的新闻发布会上表示，近期流感处于相对高发期，但未超过上一年流行季的水平。全国发热门诊和急诊患者的数量有所上升，但总体低于去年同期，医疗资源并未出现明显紧张的情况
2025-01-12 16:57:37近期流感未超过上一年流行季水平

今日热点

伊朗外交部：没人能信任美国外交灾难性经历引批评

Token有了中文名——词元！智能时代的“结算单位”

王者S43新赛季改动农场玩法唤醒经典回忆

颜如晶曾连续喝了7天特色冰浆

频道热点

主编邮箱
网上不良信息举报电话：010-56177181

关于中华网 | 广告服务 | 联系我们 | 招聘信息 | 版权声明 | 豁免条款 | 友情链接 | 中华网动态
版权所有中华网