Grok3翻车了 回答9.11比9.9大 最聪明AI的尴尬时刻。近日,马斯克与xAI团队在直播中正式发布了最新版本的Grok3。此前,马斯克曾称Grok-3为“地球上最聪明的AI”,并在X平台上表示自己整个周末都在和团队打磨产品。
然而,有媒体报道称,有人测试了最新的Beta版Grok3,并提出了那个经典的用来刁难大模型的问题:“9.11与9.9哪个大?”遗憾的是,号称目前最聪明的Grok3,在不加任何定语及标注的情况下,仍然无法正确回答这个问题。相比之下,用同样的问题询问DeepSeek时,无论是否开启深度思考模式,对方都给出了正确的答案:9.9大于9.11。
“9.11和9.9哪个大”是AI领域的一个经典问题。艾伦研究机构成员林禹臣曾在社交媒体上发布的截图显示,ChatGPT-4o认为13.11比13.8更大。他表示,虽然AI越来越擅长做数学奥赛题,但常识依旧很难。随后,Scale AI的提示工程师莱利·古德赛德基于此灵感变换了问法,拷问了当时最强的大模型ChatGPT-4o、谷歌Gemini Advanced以及Claude 3.5 Sonnet——9.11和9.9哪个更大?这些主流大模型通通答错,他也成功将此话题传播开来。
Grok-3发布会的背景板上写着“我们的使命是了解宇宙”。马斯克曾表示,xAI公司的目标就是“了解宇宙”。一周前,马斯克在直播中评论DeepSeek R1时,曾信心满满地表示“xAI即将推出更优秀的AI模型”。从现场展示的数据来看,Grok3在数学、科学与编程的基准测试上已经超越了目前所有的主流模型,马斯克甚至宣称Grok 3未来将用于SpaceX火星任务计算,并预测“三年内将实现诺贝尔奖级别突破”。
马斯克强调,Grok-3可以减少AI幻觉,方法是通过来回检查数据并尝试实现逻辑一致性。他还透露,训练Grok-3所使用的算力远多于此前的版本,并使用了大量合成数据。不同于DeepSeek的算法优化路径,xAI透露,Grok-3的开发得益于用8个月时间建成的Colossus超级计算机,它由10万个英伟达的H100 GPU驱动,为训练提供了2亿个GPU小时,比Grok-2多十多倍。
xAI还宣布推出名为Deepsearch的Grok-3智能搜索引擎,名字和Deepseek颇为相似。
她拼命解释为什么抹黑中国有利于美国,却翻了大车,外国网友直言:收钱来黑中国有什么可信度?倒是进一步证明了USAID就是美国中情局等干涉、颠覆别国的一环
2025-02-09 11:32:14这个反华分子翻车了山姆会员店近期频繁成为公众焦点,其一款弱碱性矿泉水在网络传言中被误称为“生仔水”,意外引发抢购热潮,甚至一度限购
2024-09-10 20:28:10狂飙的山姆近年来,茶饮行业热衷于联名营销,并在这一领域玩出了各种花样。例如,喜茶与Hello Kitty的联名款以其银色金属风的设计深受消费者喜爱,尤其是女性顾客
2025-01-20 15:13:11知名奶茶品牌又翻车了近日,“行走的百科全书”董宇辉在直播中聊的话题,越来越让人听不懂了。先有“不要妖魔化食品添加剂”,后有“居里夫人发现了铀,还发明了X光机”。
2024-09-30 14:47:42董宇辉纠正科普错误