中华网 china.com

新闻

Grok3翻车了 回答9.11比9.9大 最聪明AI的尴尬时刻

关键词:
2025-02-19 14:49:40  百家号

Grok3翻车了 回答9.11比9.9大 最聪明AI的尴尬时刻。近日,马斯克与xAI团队在直播中正式发布了最新版本的Grok3。此前,马斯克曾称Grok-3为“地球上最聪明的AI”,并在X平台上表示自己整个周末都在和团队打磨产品。

然而,有媒体报道称,有人测试了最新的Beta版Grok3,并提出了那个经典的用来刁难大模型的问题:“9.11与9.9哪个大?”遗憾的是,号称目前最聪明的Grok3,在不加任何定语及标注的情况下,仍然无法正确回答这个问题。相比之下,用同样的问题询问DeepSeek时,无论是否开启深度思考模式,对方都给出了正确的答案:9.9大于9.11。

“9.11和9.9哪个大”是AI领域的一个经典问题。艾伦研究机构成员林禹臣曾在社交媒体上发布的截图显示,ChatGPT-4o认为13.11比13.8更大。他表示,虽然AI越来越擅长做数学奥赛题,但常识依旧很难。随后,Scale AI的提示工程师莱利·古德赛德基于此灵感变换了问法,拷问了当时最强的大模型ChatGPT-4o、谷歌Gemini Advanced以及Claude 3.5 Sonnet——9.11和9.9哪个更大?这些主流大模型通通答错,他也成功将此话题传播开来。

Grok-3发布会的背景板上写着“我们的使命是了解宇宙”。马斯克曾表示,xAI公司的目标就是“了解宇宙”。一周前,马斯克在直播中评论DeepSeek R1时,曾信心满满地表示“xAI即将推出更优秀的AI模型”。从现场展示的数据来看,Grok3在数学、科学与编程的基准测试上已经超越了目前所有的主流模型,马斯克甚至宣称Grok 3未来将用于SpaceX火星任务计算,并预测“三年内将实现诺贝尔奖级别突破”。

马斯克强调,Grok-3可以减少AI幻觉,方法是通过来回检查数据并尝试实现逻辑一致性。他还透露,训练Grok-3所使用的算力远多于此前的版本,并使用了大量合成数据。不同于DeepSeek的算法优化路径,xAI透露,Grok-3的开发得益于用8个月时间建成的Colossus超级计算机,它由10万个英伟达的H100 GPU驱动,为训练提供了2亿个GPU小时,比Grok-2多十多倍。

xAI还宣布推出名为Deepsearch的Grok-3智能搜索引擎,名字和Deepseek颇为相似。(责任编辑:卢其龙 CN070)

关闭

县医院招保安要求35岁以下大专以上 回应:属实!

县医院招保安要求35岁以下大专以上2025-03-17 17:02:42

特朗普轰炸也门是地缘政治秀吗 战争背后的深层逻辑

特朗普轰炸也门是地缘政治秀吗2025-03-17 17:00:03

再创历史新高的黄金还能接着涨吗 三大驱动力推动金价飙升

再创历史新高的黄金还能接着涨吗2025-03-17 16:58:24

“用了18枚导弹”!美国航母突然遭袭 胡塞武装誓言报复

用了18枚导弹,美国航母突然遭袭2025-03-17 15:46:58

提振消费专项行动方案划重点 促增收惠民生

提振消费专项行动方案划重点2025-03-17 16:44:53

美方再次施压乌克兰割地 谈判僵局难解

美方再次施压乌克兰割地2025-03-17 15:45:48

英国邀20国派兵乌克兰有何意味 欧洲战略自主的尝试

英国邀20国派兵乌克兰有何意味2025-03-17 14:55:53

业内:这些城市“小阳春”初现 楼市成交回暖

业内,这些城市小阳春初现2025-03-17 16:55:34

事关和平协议 俄坚持要求乌做到两点 中立与拒入北约

事关和平协议俄坚持要求乌做到两点2025-03-17 16:39:27

匈总理要求欧盟不让乌克兰加入 向欧盟提出十二项要求

匈总理要求欧盟不让乌克兰加入2025-03-17 15:45:22

再创历史新高的黄金还能接着涨吗 三大驱动力推动金价飙升

再创历史新高的黄金还能接着涨吗2025-03-17 16:58:24

特朗普轰炸也门是地缘政治秀吗 战争背后的深层逻辑

特朗普轰炸也门是地缘政治秀吗2025-03-17 17:00:03

山西女硕士失踪案进入审查起诉阶段 卜某事件涉案人员或涉嫌强奸罪

卜某事件涉案人员或涉嫌强奸罪2025-03-17 16:40:39

县医院招保安要求35岁以下大专以上 回应:属实!

县医院招保安要求35岁以下大专以上2025-03-17 17:02:42

FBI等部门警告:美数百用户已遭“美杜莎”勒索软件攻击,威胁范围正在扩大

FBI等部门警告:美数百用户已遭“美杜莎”勒索软件攻击,威胁范围正在扩大2025-03-17 15:51:09

王晶重提35年前刘嘉玲被绑架内幕 绑匪原目标竟是她

王晶重提35年前刘嘉玲被绑架内幕2025-03-17 16:53:30

预测:菲律宾总统马科斯的结局,谁将笑到最后?

菲律宾中期选举将打响谁能笑到最后2025-03-17 14:57:27

春日氛围感花鸟图限时上线 生机盎然美景呈现

春日氛围感花鸟图限时上线2025-03-17 16:47:21

资通电军是干什么的 网络攻击与渗透真相

资通电军是干什么的2025-03-17 15:10:42

山西女硕士失踪案进入审查起诉阶段,涉嫌罪名或包括强奸罪

山西女硕士失踪案进入审查起诉阶段2025-03-17 16:38:29

平价的蜜雪冰城拥有豁免权吗 低价策略能否持续

平价的蜜雪冰城拥有豁免权吗2025-03-17 16:51:06

伊朗回应美国:勿再做以色列帮凶 坚决反对美军空袭

伊朗回应美国,勿再做以色列帮凶2025-03-17 16:39:57

2月一线城市新房价格环比继续上涨 市场分化持续

2月一线城市新房价格环比继续上涨2025-03-17 16:43:15

俄罗斯会否两手准备以战促谈,谈不拢就开打?

俄罗斯会否两手准备以战促谈2025-03-17 15:55:29

学者解读特朗普下令空袭胡塞武装 意在向伊朗发出警告

学者解读特朗普下令空袭胡塞武装2025-03-17 15:13:12

FBI等部门警告:美数百用户已遭“美杜莎”勒索软件攻击!

FBI等部门警告,美数百用户已遭美杜莎勒索软件攻击,威胁范围正在扩大2025-03-17 15:42:56

特朗普为何冒险空袭胡塞 向伊朗发出警告信号

特朗普为何冒险空袭胡塞2025-03-17 16:56:07

匈总理要求欧盟不让乌克兰加入 欧尔班提出12点要求

匈总理要求欧盟不让乌克兰加入2025-03-17 15:43:30

带大的孙女出嫁了,奶奶不舍叮嘱:照顾好自己

带大的孙女出嫁 奶奶不舍叮嘱2025-03-17 16:54:00

王树国回应“对标斯坦福” 志同道合共创未来

王树国回应对标斯坦福2025-03-17 16:42:43

俄罗斯对停火为何既积极又谨慎 战场形势决定态度

俄罗斯对停火为何既积极又谨慎2025-03-17 15:57:16

莫迪对华最新表态:确保分歧不会演变成争端,进行“健康且自然”的竞争 强调对话解决问题

莫迪对华最新表态,确保分歧不会演变成争端,进行健康且自然的竞争2025-03-17 15:51:41

乌在库尔斯克作战行动结束意味着啥 战场失利与外部施压交织

乌在库尔斯克作战行动结束意味着啥2025-03-17 14:55:23

相关新闻

×