注册登录

中华网 china.com

新闻

国内国际社会体育专题军事财经滚动政务冬奥

DeepSeek推出新模型数学推理达IMO金牌水平

小大

用微信扫描二维码
分享至好友和朋友圈

关键词：

2025-11-28 10:26:50 第一财经

11月27日晚，DeepSeek在Hugging Face上开源了一个新模型：DeepSeek-Math-V2。这是一个数学模型，也是目前首个达到IMO金牌水平且开源的模型。

DeepSeek推出新模型

在同步发布的技术论文中，DeepSeek表示Math-V2的部分性能优于谷歌旗下的Gemini DeepThink，并展示了模型在IMO-ProofBench基准以及近期数学竞赛上的表现。具体来看，在Basic基准上，DeepSeek-Math-V2达到了近99%的高分，远胜其他模型，而排在第二的Gemini Deep Think (IMO Gold)分数为89%。但在更难的Advanced子集上，Math-V2分数为61.9%，略逊于Gemini Deep Think (IMO Gold)的65.7%。

DeepSeek推出新模型数学推理达IMO金牌水平

在这篇名为《DeepSeek Math-V2：迈向可自验证的数学推理》的论文中，DeepSeek指出大语言模型已经在数学推理方面取得了重大进展，这是人工智能的重要试验台，如果进一步推进，可能会对科学研究产生影响。但当前AI在数学推理方面存在局限：以正确的最终答案作为奖励，正确的答案却不能保证正确的推理。许多数学任务如定理证明需要严格的分步推导，而不是数字答案，这使得最终答案奖励不适用。

为了突破深度推理的极限，DeepSeek认为有必要验证数学推理的全面性和严谨性。团队提出自我验证对于扩展测试时间计算尤为重要，特别是对于那些没有已知解决方案的开放问题。此次推出的Math-V2从结果导向转向了过程导向，展示了强大的定理证明能力。这一模型不依赖大量的数学题答案数据，而是通过教会AI如何像数学家一样严谨地审查证明过程，从而在没有人类干预的情况下不断提升解决高难度数学证明题的能力。

12 全文共 2 页下一页

关闭

遗体照片和遗物辨认程序开放火灾后续处理启动！

遗体照片和遗物辨认程序开放2025-11-28 10:24:54

河内公安2比1北京国安国安遭逆转无缘出线

河内公安2比1北京国安2025-11-28 10:24:42

美国男子杀妻女儿追凶15年悬案终现突破

美国男子杀妻女儿追凶15年2025-11-28 10:24:30

预计将有多股冷空气接连登场气温变化节奏快

预计将有多股冷空气接连登场2025-11-28 10:18:11

俄乌终局将近了吗乌克兰的双重绞杀

俄乌终局将近了吗2025-11-28 10:11:44

解放军演练“母港遇袭”有何信号锤炼实战化应急响应能力

解放军演练母港遇袭有何信号2025-11-28 09:25:21

俄媒展示战场上精心伪装的爆炸物纸币钱包食品玩具都能触发爆炸！

俄媒展示战场上精心伪装的爆炸物纸币钱包食品玩具都能触发爆炸2025-11-28 10:09:56

日本右翼网暴石破茂事件持续发酵！

日本右翼网暴石破茂2025-11-28 10:19:17

贺文萍：乌克兰败局已定和平计划背后的博弈

贺文萍,乌克兰败局已定2025-11-28 09:47:57

一觉醒来！万亿泡沫破裂了谷歌TPU冲击英伟达

一觉醒来,万亿泡沫破裂了2025-11-28 10:16:52

泰国洪灾女子躲冰箱 4天后获救伴母遗体度过艰难时刻

泰国洪灾女子躲冰箱4天后获救2025-11-28 10:01:53

高市早苗严重越线挑衅一意孤行终将自食其果

高市早苗严重越线挑衅一意孤行2025-11-28 09:45:09

普京称乌撤离乌控区后俄会停止行动俄军推进加速

普京称乌撤离乌控区后俄会停止行动2025-11-28 10:04:07

欧洲对美28点计划提出重大修改！

欧洲对美28点计划提出重大修改2025-11-28 09:31:28

辟谣珠峰安装电梯 AI生成虚假信息

辟谣珠峰安装电梯2025-11-28 10:21:42

暗盘“蹦极”！这家公司上市前夜，最高涨超90%，收盘仅涨2.66% 比亚迪为最大外部股东

暗盘蹦极,这家公司上市前夜,最高涨超90%,收盘仅涨2,66%2025-11-28 10:22:56

深圳14岁男生刺死同班女生被判无期

深圳14岁男生刺死同班女生被判无期2025-11-28 10:17:42

苏翊鸣回应晋级决赛：压力还是蛮大的！

苏翊鸣回应晋级决赛2025-11-28 10:11:55

13岁男孩感染甲流1天变白肺甲流高峰期一定要做好防护

13岁男孩感染甲流1天变白肺2025-11-28 10:16:07

储户起诉银行索回资金遭驳回，二审开庭！

储户起诉银行索回资金遭驳回，二审开庭2025-11-28 10:14:19

美国政治改革，留下一地鸡毛改革理想破灭

美国政治改革,留下一地鸡毛2025-11-28 10:02:06

5招快速识别流感和普通感冒了解症状差异

5招快速识别流感和普通感冒2025-11-28 10:12:28

普京亮明停战底线传递什么信号？

普京亮明停战底线传递什么信号2025-11-28 10:18:20

遗体照片和遗物辨认程序开放火灾后续处理启动！

遗体照片和遗物辨认程序开放2025-11-28 10:24:54

支行长挪用超2亿储户起诉银行败诉资金中介骗局揭秘

支行长挪用超2亿储户起诉银行败诉2025-11-28 10:19:46

行长挪用2亿获刑储户诉银行败诉储户维权路漫漫

行长挪用2亿获刑储户诉银行败诉2025-11-28 10:14:35

美国男子杀妻女儿追凶15年悬案终现突破

美国男子杀妻女儿追凶15年2025-11-28 10:24:30

埃及会购买上百架歼-10CE吗？

埃及会购买上百架歼-10CE吗2025-11-28 09:31:46

外交部回应高市早苗的“不再提及”表态：并非“撤回错误言论” 中方绝不接受性质完全不同

外交部回应高市早苗的不再提及表态,并非撤回错误言论中方绝不接受2025-11-28 09:49:25

欧盟指责美国勒索欧盟放宽数字监管贸易谈判不应捆绑

欧盟指责美国勒索欧盟放宽数字监管2025-11-28 10:00:03

河内公安2比1北京国安国安遭逆转无缘出线

河内公安2比1北京国安2025-11-28 10:24:42

国防部表示绝不允许日本军国主义幽灵再为祸人间正告日方停止修宪扩军

国防部表示绝不允许日本军国主义幽灵再为祸人间2025-11-28 10:04:24

精度高、弹种全、覆盖广远程箱式火箭炮指哪打哪！

精度高、弹种全、覆盖广远程箱式火箭炮指哪打哪2025-11-28 09:27:30

美国国民警卫队成员遭枪击嫌疑人已被拘留

美国国民警卫队成员遭枪击2025-11-28 09:18:13

杨瀚森NBA杯赛最后一分钟登场1中0 开拓者无缘淘汰赛奖金

杨瀚森NBA杯赛最后一分钟登场1中02025-11-28 10:22:38

相关新闻

DeepSeek开源新模型DeepSeek-OCR 探索视觉-文本压缩边界
10月20日，人工智能团队DeepSeek AI发布了全新多模态模型 DeepSeek-OCR
2025-10-20 20:33:14DeepSeek开源新模型DeepSeek-OCR
DeepSeek使用率暴跌原因何在？新模型R2缺席影响显著
由于新模型R2迟迟未发布，DeepSeek近期备受关注。国际知名半导体研究机构Semianalysis的报告显示，DeepSeek的用户使用率从年初的7.5%峰值显著下降至3%，官网流量同期下滑近三成
2025-07-10 13:25:04DeepSeek使用率暴跌原因何在
DeepSeek为何发表研究成果揭示AI模型秘密
证券时报的文章内容仅供参考，不构成实质性投资建议，据此操作风险自担。下载“证券时报”官方APP或关注官方微信公众号，可以随时了解股市动态，洞察政策信息，把握财富机会
2025-09-20 12:51:47DeepSeek为何发表研究成果
DeepSeek的新模型很疯狂：整个AI圈都在研究视觉路线，Karpathy不装了
DeepSeek-OCR 论文的发布在一夜之间打破了大模型的传统范式。昨天下午，全新模型 DeepSeek-OCR 开源，该模型能够将1000个字的文章压缩成100个视觉token，压缩比达到十倍且精度可达97%
2025-10-21 13:55:19DeepSeek的新模型很疯狂
DeepSeek开源新版R1 媲美OpenAI 性能媲美o3模型
DeepSeek开源了R1最新0528版本，尽管官方未对此版本进行详细说明，但已有网友在著名代码测试平台Live CodeBench中发现其性能可与OpenAI最新的o3模型高版本相媲美
2025-05-29 08:46:15DeepSeek开源新版R1媲美OpenAI
DeepSeek在《自然》杂志公布论文 R1模型成本创新低
AI初创公司DeepSeek的论文最近登上了《自然》杂志。该公司表示，其强大的AI模型R1的成功并不依赖于模仿其他大型语言模型生成的示例进行训练。这一声明随着R1模型同行评审版本的发布而公布
2025-09-20 12:18:52DeepSeek在自然杂志公布论文

今日热点

被困隧道3小时列车乘客：多人疑晕厥极端天气引发故障

李雪健写下“不怕困难光明在前”寄语激励网络正能量共创

入室抢婴案主犯曾小孩矢口否认罪行庭审现场全盘否认

浙江大范围强对流天气即将登场好天气余额不足

频道热点

主编邮箱
网上不良信息举报电话：010-56177181

关于中华网 | 广告服务 | 联系我们 | 招聘信息 | 版权声明 | 豁免条款 | 友情链接 | 中华网动态
版权所有中华网