AI大模型竞赛愈发激烈,下半场的焦点将转向推理与数据。2月23日,马斯克点赞了一条关于AI模型竞争路线的分析,并称赞其“分析得很好”。上周,马斯克旗下的xAI正式发布了Grok 3大模型。
这篇推文由Gavin Baker发布。他在文章中表示,AI产业格局正在加速变革,OpenAI的先发优势逐渐减弱,微软也在调整策略。Gavin预测,未来数据将成为竞争的核心要素,缺乏独特和有价值数据的前沿模型可能会迅速贬值。Meta等巨头通过数据垄断和算力规模构建护城河,而中小玩家则关注差异化部署和成本优化。
尽管如此,Gavin仍看好xAI和OpenAI。他认为,如果OpenAI在未来五年内仍然是该领域的领导者,可能是因为其先发优势、规模优势以及产品影响力。
当ChatGPT在2022年11月横空出世时,OpenAI通过激进押注Scaling Law,在生成式AI领域建立了长达七个季度的统治地位。然而,这一优势窗口正在关闭。Google的Gemini、xAI的Grok-3以及Deepseek的最新模型已经达到了与GPT-4相近的技术水平。就连OpenAI创始人Altman也指出,未来的领先优势将更加狭窄;微软CEO纳德拉也表示,他们在模型能力方面的领先地位即将结束。
据The Information报道,微软内部备忘录显示,由于预训练边际效益递减,原计划投入160亿美元升级预训练基础设施的方案已被叫停,微软转而专注于为OpenAI提供推理以获取收益。纳德拉在播客节目中提到,数据中心可能建设过剩,租赁优于自建,微软甚至可能会使用开源模型来支持CoPilot。这些迹象表明,单纯依靠参数扩张建立壁垒的“预训练时代”已走向终结。
随着模型架构趋同,独家数据资源成为新的护城河。Gavin多次引用Eric Vishria的观点,认为无法获得独特、有价值数据的前沿模型是历史上贬值最快的资产。如果未来前沿模型无法访问YouTube、X、TeslaVision、Instagram和Facebook等独特而有价值的数据,则可能没有任何投资回报率。从这个角度来看,扎克伯格将Meta的AI战略锚定在社交数据闭环显得更为明智。据报道,Instagram用户的图像标注数据使Meta的多模态模型训练效率提升了40%。
这一变化也将带来AI基础设施格局的颠覆性变化。Gavin预计,预训练算力需要超大规模集群(10万卡级),但参与者将缩减至2-3家,技术堆栈追求极致性能(如液冷、核能供电)。推理算力则主要集中在较小的6-10家数据中心,分布式、低成本架构主导,地理就近部署与能效比成关键。使用风/光能源和量化压缩技术(如Deepseek R1的1-bit LLM)支撑低成本推理。
未来AI行业可能呈现“预训练集中化,推理去中心化”的两极格局。数据将成为权力核心,巨头通过数据垄断和算力规模构建护城河,而中小玩家则聚焦差异化部署和成本优化。
岭南春来早,人勤地生宝。2月5日,广东省委、省政府召开新春开年第一会——全省高质量发展大会,为广东经济高质量发展描绘奋进蓝图。今年大会的主题聚焦“建设现代化产业体系”
2025-02-06 13:22:24广东省委书记点赞DeepSeek