注册登录

中华网 china.com

新闻

国内国际社会体育专题军事财经滚动政务冬奥

大模型集体失智：9.11和9.9哪个大，几乎全翻车了

小大

用微信扫描二维码
分享至好友和朋友圈

关键词：

2024-07-18 09:34:37 海报新闻

大模型集体失智：9.11和9.9哪个大，几乎全翻车了

近期，一个看似简单的数学问题挑战了众多前沿的人工智能大模型，引发了业界的关注。问题本身并不复杂：9.11和9.9哪个数字更大？然而，在第一财经记者的测试中，即便是先进的AI系统也出现了分歧。在12款接受测试的大模型中，只有阿里通义千问、百度文心一言、Minimax和腾讯元宝给出了正确的答案，剩余八款模型，包括知名的ChatGPT-4o等，则在这个基础数学问题上栽了跟头。

这些出错的大模型大多陷入了比较小数点后数字的误区，误以为9.11大于9.9。即使记者明确指出是在数学的语境下进行比较，类似ChatGPT这样的顶尖大模型也未能避免错误。这揭示了长久以来大模型在处理数学问题上的不足，反映出它们的设计更偏向于文字处理而非数字逻辑。

该现象的起因可追溯至一档综艺节目中的投票率比较，观众对13.8%与13.11%的大小产生争议，进而引发了公众对AI处理此类基本数学问题能力的好奇和测试。测试结果显示，许多AI在面对这类基础数学问题时显得力不从心，尽管它们在复杂的语言任务上表现出色。

探究其背后的原因，专家们指出，生成式语言模型的本质决定了它们更擅长处理基于文本的关联性任务，而非数学所需的逻辑推理和精确计算。语言模型通过学习海量文本数据来预测下一个词，这使得它们在文学创作上能够展现出接近人类的水平，但在需要严谨逻辑和抽象思维的数学领域，却显得力有未逮。此外，数字处理时的分词问题也是导致错误的一个技术因素，现有分词器往往没有针对数学计算进行优化，可能导致数字被错误分割，影响模型的理解。

12 全文共 2 页下一页

关闭

卡德罗夫授予普京车臣荣誉公民称号时隔13年再访车臣

卡德罗夫授予普京车臣荣誉公民称号2024-08-22 08:55:23

媒体人评两男子捉44只壁虎被刑拘保护"三有"动物成焦点

媒体人评两男子捉44只壁虎被刑拘2024-08-22 08:43:25

今年第10号台风“珊珊”生成未来五天对中国海域无影响

今年第10号台风“珊珊”生成2024-08-22 08:42:36

波兰边境集结坦克将与俄开战？假的系建军节游行活动

波兰边境集结坦克将与俄开战？假的2024-08-22 08:39:11

日本在小岛建导弹靶场，连美媒都盯上了

日本在小岛建导弹靶场，连美媒都盯上了2024-08-21 09:32:02

媒体人评两男子捉44只壁虎被刑拘保护"三有"动物成焦点

媒体人评两男子捉44只壁虎被刑拘2024-08-22 08:43:25

今年第10号台风“珊珊”生成未来五天对中国海域无影响

今年第10号台风“珊珊”生成2024-08-22 08:42:36

《红楼梦之金玉良缘》票房暴跌导演斥AI恶意评分

《红楼梦之金玉良缘》票房暴跌2024-08-22 08:18:54

画面曝光！“美军事人员现身库尔斯克”

画面曝光！“美军事人员现身库尔斯克”2024-08-21 10:14:20

美国不断拱火菲律宾，中方：美无权介入中菲涉海问题

美国不断拱火菲律宾，中方：美无权介入中菲涉海问题2024-08-21 10:05:19

被虐致死女童母亲称男方重男轻女求判生父及其女友死刑

被虐致死女童母亲称男方重男轻女2024-08-22 08:36:26

王俊凯说别模仿我吃中药拌面年轻人的"发疯"态度

王俊凯说别模仿我吃中药拌面2024-08-22 08:18:30

新疆阿克苏库车市发生5.0级地震震源深度15千米

新疆阿克苏库车市发生5.0级地震2024-08-22 08:19:13

美国批准对韩出售36架“阿帕奇”直升机

美国批准对韩出售36架“阿帕奇”直升机2024-08-21 10:13:29

免疫力下降、增加癌症风险、损伤耳朵......有这种睡眠习惯的人要注意

免疫力下降、增加癌症风险、损伤耳朵......有这种睡眠习惯的人要注意2024-08-22 08:38:01

杜兰特谈奥运会逆转塞尔维亚末节狂飙20分反超

杜兰特谈奥运会逆转塞尔维亚2024-08-22 08:26:26

日本民间团体代表：冲绳不需要美军基地

日本民间团体代表：冲绳不需要美军基地2024-08-21 10:08:02

捷克将利用被冻俄资产的收益为乌克兰提供弹药

捷克将利用被冻俄资产的收益为乌克兰提供弹药2024-08-21 09:59:55

处暑在中，三九暴雪”今冬雪多吗？冷冬预警：农谚解析来啦

“处暑在中，三九暴雪” 今冬雪多吗？2024-08-22 08:36:14

美媒称拜登已批准一项高度机密核战略，首次将重心转向“中国核威胁”

美媒称拜登已批准一项高度机密核战略，首次将重心转向“中国核威胁”2024-08-21 09:55:03

美方军事人员被曝参与袭击俄罗斯库尔斯克州

美方军事人员被曝参与袭击俄罗斯库尔斯克州2024-08-21 10:00:31

德国暂缓军援乌克兰？朔尔茨回应

德国暂缓军援乌克兰？朔尔茨回应2024-08-21 09:36:53

房东嫌我问题太多不想租给我了事儿多引租忧

房东嫌我问题太多不想租给我了2024-08-22 08:36:53

《黑神话：悟空》在台湾火了中华文化魅力席卷全球

《黑神话：悟空》在台湾火了2024-08-22 08:19:27

北京：免疫力下降、增加癌症风险、损伤耳朵......有这种睡眠习惯的人要注意

北京：免疫力下降、增加癌症风险、损伤耳朵......有这种睡眠习惯的人要注意2024-08-22 08:37:46

王楚钦说混双夺金是最开心的瞬间搭档孙颖莎功不可没

王楚钦说混双夺金是最开心的瞬间2024-08-22 08:35:01

俄乌就谈判问题激烈交锋：俄外长称目前不可能恢复对话，乌总统称正在实现战略目标

俄乌就谈判问题激烈交锋：俄外长称目前不可能恢复对话，乌总统称正在实现战略目标2024-08-21 10:18:03

卡德罗夫授予普京车臣荣誉公民称号时隔13年再访车臣

卡德罗夫授予普京车臣荣誉公民称号2024-08-22 08:55:23

机器鹰、机器鱼……军用仿生机器人崭露头角

机器鹰、机器鱼……军用仿生机器人崭露头角2024-08-22 09:10:42

壮胆？台军动用多种导弹进行“精准导弹射击”演练

壮胆？台军动用多种导弹进行“精准导弹射击”演练2024-08-21 09:45:37

以防长：以军重心将从加沙逐步转向黎以边界

以防长：以军重心将从加沙逐步转向黎以边界2024-08-21 09:59:23

日本：中国海军075型两栖攻击舰穿越宫古海峡

日本：中国海军075型两栖攻击舰穿越宫古海峡2024-08-21 09:56:41

俄媒：普京2011年以来首次视察俄车臣共和国，卡德罗夫在机场迎接

俄媒：普京2011年以来首次视察俄车臣共和国，卡德罗夫在机场迎接2024-08-21 10:17:01

都是奔着毁容去的？一晚上全是！杭州医生：我清创清吐了

都是奔着毁容去的？一晚上全是！杭州医生：我清创清吐了2024-08-22 08:42:17

俄乌在库尔斯克战事“白热化”，俄乌“决胜”是否在此？

俄乌在库尔斯克战事“白热化”，俄乌“决胜”是否在此？2024-08-21 10:37:27

相关新闻

今日热点

专家：伊朗在中东影响力达到顶峰 2024年达到极盛

记者：阿联酋帮助俄乌换俘战火中的短暂曙光

美国连发两起恶性事件极端行为震惊全国

全国甲流感染进入高发期致晕“新毒株”引关注

频道热点

主编邮箱
网上不良信息举报电话：010-56177181

关于中华网 | 广告服务 | 联系我们 | 招聘信息 | 版权声明 | 豁免条款 | 友情链接 | 中华网动态
版权所有中华网