中华网 china.com

新闻

英伟达创满血DeepSeek推理世界纪录 性能显著提升

关键词:
2025-03-20 09:03:59  IT之家

英伟达在NVIDIA GTC 2025上宣布,其NVIDIA Blackwell DGX系统创下DeepSeek-R1大模型推理性能的世界纪录。在搭载了八块Blackwell GPU的单个DGX系统上运行6710亿参数的满血DeepSeek-R1模型可实现每用户每秒超250 token的响应速度,系统最高吞吐量突破每秒3万token。

英伟达创满血DeepSeek推理世界纪录

随着NVIDIA平台继续在最新的Blackwell Ultra GPU和Blackwell GPU上突破推理极限,其性能将会不断提高。例如,在运行TensorRT-LLM软件的NVL8配置的NVIDIA B200 GPU上,单节点配置为DGX B200(8块GPU)与DGX H200(8块GPU),测试参数为输入1024 token / 输出2048 token;此前测试为输入/输出各1024 token,计算精度方面,B200采用FP4,H100/H200采用FP8精度。

英伟达创满血DeepSeek推理世界纪录 性能显著提升

自2025年1月以来,通过硬件和软件的结合,英伟达成功将DeepSeek-R1 671B模型的吞吐量提高了约36倍。节点配置包括DGX B200(8块GPU)、DGX H200(8块GPU)以及两个DGX H100(8块GPU)系统,测试参数依然采用TensorRT-LLM内部版本,输入1024 token / 输出2048 token,并发性MAX,计算精度方面,B200采用FP4,H100/H200采用FP8精度。

英伟达创满血DeepSeek推理世界纪录 性能显著提升

与Hopper架构相比,Blackwell架构与TensorRT软件相结合实现了显著的推理性能提升。DGX B200平台在运行TensorRT软件并使用FP4精度时,与DGX H200平台相比提供了3倍以上的推理吞吐量提升,适用于包括DeepSeek-R1、Llama 3.1 405B和Llama 3.3 70B在内的多个模型。在对模型进行量化以利用低精度计算优势时,确保精度损失最小化是生产部署的关键。在DeepSeek-R1模型上,相较于FP8基准精度,TensorRT Model Optimizer的FP4训练后量化技术在不同数据集上仅产生微乎其微的精度损失。

关闭

男生去镇上洗头免费吹造型效果惊人!这个服务区共20项服务全部免费

男生去镇上洗头免费吹造型效果惊人2025-04-14 15:04:03

合肥深山惊现百木之王 古老灰楸树绽放紫花

合肥深山惊现百木之王2025-04-14 15:02:14

上海发现中国未有神秘生物 类奇异布纹藻现身

上海发现中国未有神秘生物2025-04-14 15:00:03

美方纠错的步子应该迈得更大一些 关税松动信号显现

美方纠错的步子应该迈得更大一些2025-04-14 14:07:08

辟谣美国建厂!百余股火速回应稳信心:关税影响有限 澄清声明稳定市场情绪

002475,辟谣美国建厂,百余股火速回应稳信心,关税影响有限2025-04-14 14:08:56

日本人大幅抛售美国国债?自民党高官表态

日本自民党高官就美债问题表态2025-04-14 14:17:34

越野车玩水被冲走两人遇难 网红景点悲剧引发关注

越野车玩水被冲走两人遇难2025-04-14 14:58:48

男生去镇上洗头免费吹造型效果惊人!这个服务区共20项服务全部免费

男生去镇上洗头免费吹造型效果惊人2025-04-14 15:04:03

小孩跳楼砸坏新车家长只赔几百 车主索赔遇阻

小孩跳楼砸坏新车家长只赔几百2025-04-14 14:52:20

上海发现中国未有神秘生物 类奇异布纹藻现身

上海发现中国未有神秘生物2025-04-14 15:00:03

全球发布!哈工大打造机器人领域顶级国际期刊 汇聚全球顶尖学术资源

全球发布,哈工大打造机器人领域顶级国际期刊2025-04-14 14:56:35

媒体:欧洲版“星链”前路漫漫 自主之路挑战重重

媒体,欧洲版星链前路漫漫2025-04-14 14:54:27

美伊首轮间接谈判结束 建设性对话继续

美伊首轮间接谈判结束2025-04-14 15:03:59

大阪世博会中国馆排队一眼望不到头 中国馆成“顶流”

大阪世博会中国馆排队一眼望不到头2025-04-14 14:50:52

一峪口贴警告“两年失联9人” 提醒游客勿走小路

一峪口贴警告两年失联9人2025-04-14 14:54:22

俄罗斯最新涉华表态 中俄石油合作前景广阔

俄罗斯最新涉华表态2025-04-14 14:15:14

默茨称将限制移民德国人数 减轻基础设施压力

默茨称将限制移民德国人数2025-04-14 15:03:33

老婆睡觉前被老公惹怒,老婆一个动作当场把老公治服

女子睡觉前被惹怒 一招把老公治服2025-04-14 14:54:46

合肥深山惊现百木之王 古老灰楸树绽放紫花

合肥深山惊现百木之王2025-04-14 15:02:14

欧盟磋商设立共同防务基金 促进统一军购

欧盟磋商设立共同防务基金2025-04-14 14:03:35

“卤鹅哥”回应10万元奖励 房贷与车贷的及时雨

卤鹅哥回应10万元奖励2025-04-14 14:52:02

美国反复打脸又挽尊伤最狠是自身 关税政策自食其果

美国反复打脸又挽尊伤最狠是自身2025-04-14 14:50:29

雷霆本赛季68胜创队史新纪录 历史级别战绩

雷霆本赛季68胜创队史新纪录2025-04-14 14:58:17

欧洲芯片厂齐声警告加税风暴 恐雪上加霜

欧洲芯片厂齐声警告加税风暴2025-04-14 14:18:54

当地回应小区8楼承重墙被凿 建议加固恢复处理

当地回应小区8楼承重墙被凿2025-04-14 14:56:08

尹锡悦出席公审 首场审判开启

尹锡悦出席公审2025-04-14 14:06:02

台民调称近六成民众反对“大罢免” 主流民意不赞成

台民调称近六成民众反对大罢免2025-04-14 14:04:21

一名乌克兰F-16飞行员死亡 泽连斯基誓言回应

一名乌克兰F-16飞行员死亡2025-04-14 14:15:31

关税救不了美国制造 违背经济规律

关税救不了美国制造2025-04-14 14:15:48

TVB视帝王浩信想挑战一下古偶赛道和拍乡村爱情

TVB视帝王浩信想拍乡村爱情2025-04-14 14:47:55

2年半卖出30万罐,90后厨师为什么要把“奶油”塞进自动售货机?

2年半卖出30万罐,90后厨师为什么要把“奶油”塞进自动售货机?2025-04-14 14:48:27

10个会悄悄让人变胖的习惯 警惕这些小习惯

10个会悄悄让人变胖的习惯2025-04-14 14:51:45

美国高管一家5口坠机遇难 美直升机无记录仪 事故调查面临挑战

美国高管一家5口坠机遇难美直升机无记录仪2025-04-14 14:10:35

伊朗与美国首轮间接谈判结束 会谈将在下周继续进行

伊朗与美国首轮间接谈判结束2025-04-14 14:59:25

离开中国后,“甲亢哥”:想念“卤鹅哥” 会带他去美国 真挚友情跨越国界

离开中国后,甲亢哥,想念卤鹅哥会带他去美国2025-04-14 14:10:19

相关新闻