2月26日,在开源周的第三天,DeepSeek宣布开放高效的FP8 GEMM库DeepGEMM。这三天发布的都是与算法相关的技术内容。OpenCSG创始人陈冉表示,DeepSeek以前是直接提供一个模型,现在则深入挖掘背后的技术细节和框架,这些“脚手架”的开源有利于后续生态的建设。
此次发布的关键词GEMM(通用矩阵乘法)是线性代数中的基本运算,而FP8 GEMM则是一种使用8位浮点数进行矩阵乘法的计算操作。FP8是一种低精度浮点格式,适用于深度学习和高性能计算,能够在保持较高计算效率的同时减少内存占用和带宽需求。
DeepSeek介绍称,DeepGEMM支持传统的稠密模型和MoE模型的GEMM运算,为基于英伟达Hopper架构的V3/R1系列硬件提供高效的训练和推理支持。在英伟达Hopper架构的GPU上,DeepGEMM可实现超过1350 FP8 TFLOPS的性能,充分利用算力。该代码库设计简洁,只有一个核心内核函数,约300行代码,但在大多数矩阵规模上优于专家调优的内核。
DeepGEMM通过FP8和硬件级优化解决了大模型计算效率和资源消耗的问题,尤其是对MoE模型的落地提供了关键支持。其开源行为不仅加速了技术民主化,还可能成为AI计算生态的基础设施,推动行业向更高效、低成本的方向发展。FP8作为AI计算的新兴标准,可以加速千亿参数模型的训练,降低显存需求。在边缘设备或云端部署时,FP8的低精度计算能显著提升吞吐量,降低成本。因此,开源DeepGEMM可以推动FP8生态普及,降低开发者使用门槛,促进更多框架和模型适配FP8,加速行业向低精度计算迁移。
此外,MoE模型因计算复杂性难以落地,DeepGEMM的开源提供了高效实现参考,可能催生更多MoE应用,如多模态模型和边缘端高效模型。陈冉认为,DeepSeek连续三天的代码库开源非常震撼,表明他们愿意分享技术细节。长期来看,这一开源动作非常有意义,既有模型标准,也有工具标准,还有生态基石,有助于整个生态的发展。陈冉判断,DeepSeek的代码开源或许会影响一批从事AI Infra层的从业者,但这种开源是一把双刃剑,用得好可能得利,用不好则会被冲击。也有从业者认为,DeepSeek开源的是Infra层的推理加速部分,虽然有影响,但不会太大。
DeepSeek在此前宣布会陆续开源五个代码库,接下来还有两个代码库将在本周发布。每分享一行代码,都会成为加速AI行业发展的集体动力。
2月26日,在开源周第三天,DeepSeek宣布开放高效的FP8 GEMM库DeepGEMM。这三天的发布内容都与算法相关,偏向技术层面
2025-02-26 21:35:35DeepSeek开源第三日行业影响几何2月21日,DeepSeek通过其官方社交平台宣布,将在接下来的一周内陆续开源5个代码库,并分享最新的技术进展。DeepSeek表示,在线服务模块已经过严格测试和部署,具备投入生产环境的能力
2025-02-21 20:05:58DeepSeek将开源5个代码库杭州深度求索公司DeepSeek近期爆火,其开源策略迫使多家头部大模型企业紧急调整战略布局。百度、阿里、腾讯、网易等将旗下多款产品接入DeepSeek
2025-02-18 09:49:00大厂拥抱DeepSeek自家大模型去哪了春节期间,DeepSeek热潮席卷全球。A股市场中,与DeepSeek相关的股票如每日互动、青云科技、安恒信息、天娱数科等,在春节后的两个交易日连续涨停
2025-02-07 03:21:24媒体