马斯克宣布Grok4发布 超越人类推理能力!xAI终于发布了下一代大模型Grok 4,其能力超乎想象。北京时间今天中午12点左右,马斯克在直播中表示这是世界上最好的AI,并展示了其强大功能。
Grok 4无需事先查看题目就能在SAT考试中获得满分,GRE任何学科也能接近满分,超过了所有研究生的水平。马斯克认为Grok 4可以实现科学新发现。由于计算能力和强化学习的提升,Grok 4的推理能力比前代提升了10倍。从Grok 2到Grok 4的技术范式不断升级,包括下一个token预测、预训练计算、预训练+RL和RL计算。
Grok 4还增强了调用工具的能力,在各类高难度Benchmark上表现远超SOTA。在HLE(人类最后的考试)中,Grok 4使用工具后的成绩为38.6%,而Grok 4 Heavy的成绩达到了44.4%。如果让大模型花费更多时间思考并适当使用外部工具,HLE分数能进一步提升到50.7%。此外,在GPQA、AIME25、LCB、HMMT25和USAMO25等基准测试中,Grok 4 Heavy均取得了最新SOTA。
Grok 4已经实现了博士后水平,在所有学科都能表现出色。马斯克多次强调,Grok将在今年内实现新的科学技术发现。根据Artificial Analysis的评估,Grok 4总成绩达到了73分,领先于o3、Gemini 2.5 Pro、Claude 4 Opus和DeepSeek R1 0528。
Grok 4不仅在语言基准测试中表现出色,还在语音能力、角色多样性等方面得到了加强。语音速度快了2倍,支持5种语音,单日用户总停留时长提升了10倍。新增的角色Eve和Sal已在iOS版Grok中可用,其中Sal支持多种性格,Eve可以唱歌和低语。
在ARC-AGI基准测试中,Grok 4取得了最新SOTA,特别是在ARC-AGI-2上达到15.9%。在Vending-Bench基准测试中,Grok 4也超越了其他模型,显示了其在真实物理世界中执行复杂操作任务的能力。
Grok 4可通过API调用,提供256K tokens的上下文窗口,现已开放使用。DannyLimanseta用Grok 4在4小时内制作了一款FPS射击游戏,效果非常不错。接下来,xAI还将发布代码模型、多模态智能体以及视频生成模型。目前,Grok 4已经上线,但需要付费使用,价格较为昂贵。年付SuperGrok为300美元,SuperGrok Heavy则为每年3000美元。
当地时间7月9日,马斯克旗下的人工智能公司xAI正式发布了Grok 4。这是该公司自2023年推出首代大模型以来的第四次重要迭代,号称是“世界上最强AI模型”
2025-07-10 19:22:08马斯克发布Grok4大模型号称世界最强当地时间7月5日,美国亿万富翁埃隆·马斯克在社交媒体上发布消息:“今天,‘美国党’的成立还给你们自由。”马斯克是在对他4日所发一条贴文的回复中作出上述表述的。
2025-07-06 07:51:55马斯克在社交媒体上宣布“美国党”成立自2022年埃隆·马斯克收购推特并将其更名为X以来,该平台一直在努力拓展其功能和用户群体。曾经以公开分享观点和制造热点话题为主的X,如今正朝着更加注重隐私和日常应用的方向发展
2025-06-02 10:36:18马斯克宣布推出全新XChat马斯克在社交媒体X平台上表示,由于X、xAI和特斯拉正处于关键技术发布期,下周还有星舰发射,他已回归全天候工作状态。此前,马斯克旗下的社交平台X在24日早间发生大规模宕机,目前服务已基本恢复
2025-05-25 09:59:05马斯克回归全天候工作状态