12月5日,美国大孟菲斯商会宣布,马斯克的人工智能初创公司xAI计划将其超级计算机项目Colossus的算力扩大十倍,未来将搭载100万块GPU,以对抗谷歌、OpenAI和Anthropic等竞争对手。Colossus被认为是世界上最大的超级计算机之一,也是建设速度最快的超级计算机项目,马斯克仅用了3个月就完成了该计算机集群的建设。英伟达创始人黄仁勋曾表示,这种规模的数据中心通常需要三年才能建成,称马斯克的成就为“奇迹”。
目前,Colossus运行着由10万多块英伟达GPU组成的集群,这些芯片用于训练xAI的聊天机器人Grok。尽管如此,Grok的用户数量仍少于市场领导者OpenAI的ChatGPT或谷歌的Gemini。马斯克计划中的Colossus扩张预计需要数百亿美元的投资,还需大规模的服务器供电和冷却系统支持。
除了xAI,英伟达、戴尔和超微电脑等公司也将在孟菲斯扩张。今年早些时候,戴尔和超微电脑宣布将为xAI提供服务器机架。xAI今年已融资约110亿美元,大部分资金被用于购买英伟达的GPU芯片。
根据网站LessWrong的数据,全球拥有最多GPU的公司包括谷歌、微软、Meta、亚马逊以及xAI。如果以H100芯片算力来计算,谷歌目前拥有100万至150万块等效H100,明年预计达到350万至420万块;微软拥有75万至90万块等效H100,明年预计达到250万至310万块;Meta拥有55万至65万块等效H100,明年预计达到190万至250万块;亚马逊拥有25万至40万块等效H100,明年预计达到130万至160万块;xAI拥有10万块等效H100,明年预计达到55万至100万块。这意味着,xAI要赶上这些科技巨头还需要付出很大努力。
目前,xAI使用了大约2万块H100训练Grok 2大模型,并计划用10万块H100训练Grok 3大模型。随着英伟达最新一代Blackwell芯片开始大量出货,马斯克宣称将在2025年夏天部署一个有30万块Blackwell芯片的运算集群。一份2024 AI现状报告对Blackwell芯片采购量进行了估算,大型云计算公司正在大规模采购英伟达的GB200系统:微软介于70万到140万块之间,谷歌为40万块,OpenAI也将拥有至少40万块,亚马逊AWS为36万块。
过去一年中,科技公司在争夺人工智能芯片资源方面投入巨大,并积极建设AI基础设施。风投机构Menlo Ventures的数据显示,生成式AI市场的收入预计将在十年内超过1万亿美元,而今年企业在生成式AI上的支出激增500%。
AI基础设施的竞争日益激烈,马斯克的人工智能初创公司xAI计划大幅扩展其位于孟菲斯基地的Colossus超级计算机,目标是将图形处理单元(GPU)数量提升至100万个
2024-12-06 10:19:30100万个GPU12月14日,2024科学家创新大会在雄安召开。会上,多位院士专家讨论了遥感产业的未来发展,认为推动算力“上天”将成为产业未来发展的大趋势
2024-12-17 02:16:45我国将构建天地一体化算力网络2024中国算力大会将于9月27日至29日在河南郑州举行,华为将参与此次大会,主题定为“共赢算力新时代”
2024-09-25 09:12:00华为将参加2024中国算力大会9月19日,华为全联接大会在上海拉开帷幕,公司轮值董事长徐直军针对人工智能(AI)发表了重要见解。他强调,华为正全力推进智能化转型,这是一个长期旅程,算力则是智能化的核心支撑
2024-09-19 21:15:00华为徐直军谈AI算力热潮算力作为数字经济时代的关键生产力,自“东数西算”工程于2022年启动以来,极大地促进了全国一体化算力网的建设速度,为全球数字经济发展奠定了坚实的基础设施
2024-09-04 11:40:59算力发展呈规模化、经济化、多样化趋势