在人工智能芯片的竞争中,英伟达凭借其强大的技术实力和完整的生态系统,构筑了难以逾越的壁垒。然而,随着AI应用场景的扩展,特别是在推理阶段的需求爆发,AMD等竞争者正在寻找突破口。
最新消息显示,AMD利用DeepSeek模型走红的机会,宣布将新的DeepSeek-V3模型集成到Instinct MI300X GPU上。这一集成旨在与SGLang配合使用,以实现最佳性能。DeepSeek-V3专门针对AI推理进行了优化,表明AMD正在积极布局AI应用落地场景。
这种合作反映了AI行业格局的变化。过去两年,大模型的训练需求主导了算力市场,英伟达凭借CUDA生态和H100系列GPU占据绝对优势。但随着大模型进入应用落地阶段,推理需求激增,企业更关注成本、能效和部署灵活性。AMD瞄准这一窗口期,试图通过优化推理性能打破英伟达的垄断。
AMD的Instinct MI300X是其AI战略的核心武器。这款采用Chiplet设计的GPU集成1460亿晶体管,配备192GB HBM3内存,专为大规模AI推理设计。据AMD数据,MI300X的推理性能较英伟达H100提升30%,内存带宽达5.3TB/s,尤其擅长实时对话、图像生成等低延迟任务。不过,MI300X面临生态短板和产能瓶颈两大挑战。
英伟达的CUDA生态已形成近乎垄断的开发者壁垒,全球90%的AI框架依赖其工具链。尽管AMD推出开源的ROCm平台并适配PyTorch、TensorFlow,但迁移成本高、社区支持不足的问题依然突出。例如,Meta虽采用MI300X运行Llama 3.1模型的推理任务,但训练阶段仍依赖英伟达芯片。此外,2023年底台积电先进封装产能紧张导致MI300X交付延迟,部分客户转投英伟达,也暴露出AMD在供应链管理上的脆弱性。
为应对挑战,AMD加速硬件迭代并强化生态合作。2024年6月,AMD推出了升级版的MI325X芯片,这款产品采用了8个计算芯片、4个I/O芯片和8个内存芯片的复杂设计,通过2.5D和3D封装技术实现整合。在性能方面,MI325X提供了1.3petaFLOPS的BF/FP16性能,或2.6petaFLOPS的FP8性能,超过了英伟达的H200。特别是在内存容量上,MI325X配备了288GB的HBM3e内存,是H200的两倍多,内存带宽达到6TB/S。
AI芯片领域的领军企业英伟达就近期关于其AI芯片延期发布的传言进行了回应
2024-08-04 21:05:19英伟达回应AI芯片推迟发布随着人工智能技术的迅速发展,英伟达公司凭借其在AI芯片领域的专注迎来了市值的显著增长。截至美国当地时间21日,英伟达的市值达到了3.525万亿美元的历史新高,首次突破3.5万亿美元大关
2024-10-22 11:51:00英伟达市值逼近全球第一苹果近日,Wall Street知名分析师丹·艾夫斯,来自Wedbush证券公司,对科技巨头英伟达做出了一个生动的比喻,将其潜力与篮球界的传奇人物勒布朗·詹姆斯相提并论,强调英伟达如同青少年时期的詹姆斯
2024-09-02 17:00:27分析师:英伟达就像高中时的詹姆斯