注册登录

中华网 china.com

新闻

国内国际社会体育专题军事财经滚动政务冬奥

清华团队突破大模型算力难题英伟达面临挑战

小大

用微信扫描二维码
分享至好友和朋友圈

关键词：

2025-02-15 16:16:59 新浪

清华大学KVCache.AI团队联合趋境科技发布了KTransformers开源项目的重大更新，成功打破了大模型推理算力的门槛。这次更新支持在24G显存（4090D）的设备上本地运行DeepSeek-R1、V3的671B满血版。

KTransformers项目的核心在于异构计算策略。通过稀疏性利用，MoE架构每次仅激活部分专家模块，团队将非共享的稀疏矩阵卸载至CPU内存，并结合高速算子处理，使显存占用压缩至24GB。此外，项目采用了4bit量化技术，配合Marlin GPU算子，效率提升了3.87倍；CPU端通过llamafile实现多线程并行，预处理速度达到286 tokens/s。CUDA Graph加速减少了CPU/GPU通信开销，单次解码只需一次完整的CUDA Graph调用，生成速度可达14 tokens/s。

这一突破带来的影响显著。传统方案中，使用8卡A100服务器的成本超过百万，按需计费每小时数千元。而现在，单卡RTX 4090方案的整机成本约为2万元，功耗仅为80W，非常适合中小团队和个人开发者。NVIDIA RTX 4090运行DeepSeek-R1满血版的案例不仅展示了技术奇迹，也是开源精神与硬件潜能结合的典范。这证明了在AI快速发展的时代，创新往往源于对“不可能”的挑战。

(责任编辑：张蕾)

关闭

联想MWC 2025发布概念性笔电生态模块化AI创新引领未来

联想MWC2025发布概念性笔电生态2025-03-03 17:13:41

奚梦瑶何超欣姑嫂出游像闺蜜奚梦瑶何超欣一起出游参观法国酒庄

奚梦瑶何超欣姑嫂出游像闺蜜2025-03-03 17:08:37

全球每年120万人因吸二手烟死亡每4秒1人逝去

全球每年120万人因吸二手烟死亡2025-03-03 17:08:06

美国多地爆发“抵制特斯拉”示威活动，白宫发声抗议持续蔓延

美国多地爆发抵制特斯拉示威活动,白宫发声2025-03-03 14:44:43

新研究揭示月球水源双重起源挑战太阳风理论

新研究揭示月球水源双重起源2025-03-03 16:51:53

白宫碰壁后泽连斯基在唐宁街受到礼遇，欧洲在压力与无奈中集结欧洲集结声援乌克兰

白宫碰壁后泽连斯基在唐宁街受到礼遇,欧洲在压力与无奈中集结2025-03-03 16:33:24

全球每年120万人因吸二手烟死亡每4秒1人逝去

全球每年120万人因吸二手烟死亡2025-03-03 17:08:06

《180天重启计划》母女成长之路温情治愈之旅

180天重启计划母女成长之路2025-03-03 16:49:33

种种迹象表明，美国准备搞掉泽连斯基了换一个听话的人

种种迹象表明,美国准备搞掉泽连斯基了2025-03-03 14:37:51

山东新人冒雪结婚一秒“白头” 真爱无惧风雪

山东新人冒雪结婚一秒白头2025-03-03 16:44:58

毛不易演唱会北方三城官宣东北家乡惊喜连连

毛不易演唱会北方三城官宣2025-03-03 17:05:12

各地抢抓“春日经济”流量红利赏花热带动旅游消费

各地抢抓春日经济流量红利2025-03-03 16:54:02

美国经济的危险深渊：从“拜登通胀”到“特朗普滞胀”？滞胀风险加剧

美国经济的危险深渊,从拜登通胀到特朗普滞胀2025-03-03 14:29:16

若特朗普说话算数乌军将有多惨？援助切断后果严重

若特朗普说话算数乌军将有多惨2025-03-03 16:45:31

政协委员建议合理控制医保保费涨幅探索匹配收入增长机制

政协委员建议合理控制医保保费涨幅2025-03-03 16:43:11

德媒发现冯德莱恩对中国口气变了寻求合作新契机

德媒发现冯德莱恩对中国口气变了2025-03-03 17:00:02

寒潮来袭，雪中济南“菜篮子”量足价稳！

寒潮来袭雪中济南菜篮子量足价稳2025-03-03 16:54:35

奚梦瑶何超欣姑嫂出游像闺蜜奚梦瑶何超欣一起出游参观法国酒庄

奚梦瑶何超欣姑嫂出游像闺蜜2025-03-03 17:08:37

泽连斯基与特朗普谈崩后欧洲能重回俄乌冲突谈判桌吗？欧洲面临历史性抉择

泽连斯基与特朗普谈崩后欧洲能重回俄乌冲突谈判桌吗2025-03-03 16:43:07

泽连斯基称当下取代他并不容易愿辞职换北约成员资格

泽连斯基称当下取代他并不容易2025-03-03 16:07:21

泽连斯基反讽称可以授予美议员乌公民身份这样他声音才有分量

泽连斯基反讽称可以授予美议员乌公民身份2025-03-03 14:25:48

专家谈特朗普所信奉的“交易艺术” 极限施压俄乌局势

专家谈特朗普所信奉的交易艺术2025-03-03 14:58:40

白鹿说因为《警察荣誉》才能演《北上》

白鹿说因为警察荣誉才能演北上2025-03-03 17:00:29

美乌领导人谈崩，马克龙“劝架”！呼吁冷静与尊重

美乌领导人谈崩,马克龙劝架2025-03-03 15:31:48

台名嘴围观白宫“世纪争吵”后反思“人为刀俎我为鱼肉”“当棋子的悲哀”

台名嘴围观白宫“世纪争吵”后反思2025-03-03 16:29:44

乌步兵战车遭俄无人机袭击后殉爆俄军光纤无人机精确打

乌步兵战车遭俄无人机袭击后殉爆2025-03-03 16:27:32

美媒称欧洲正从美国手中夺取和谈主导权英法提议乌克兰停火一个月

美媒称欧洲正从美国手中夺取和谈主导权2025-03-03 16:47:51

官方通报马拉松选手在中学门前小便不文明行为遭谴责

官方通报马拉松选手在中学门前小便2025-03-03 16:58:49

缅甸4名高级军官涉嫌电诈被拘打击行动持续升级

缅甸4名高级军官涉嫌电诈被拘2025-03-03 16:47:07

联想MWC 2025发布概念性笔电生态模块化AI创新引领未来

联想MWC2025发布概念性笔电生态2025-03-03 17:13:41

泽连斯基再表态：愿以辞职换取乌克兰加入北约坚定立场引发关注

泽连斯基再表态,愿以辞职换取乌克兰加入北约2025-03-03 16:09:51

特朗普发话少担心普京多担心移民问题关注国内安全挑战

特朗普发话少担心普京多担心移民问题2025-03-03 14:46:16

泽连斯基：“没有一天不感激”美国强调美国支持的重要性

泽连斯基,没有一天不感激美国2025-03-03 14:23:27

102项重大工程98%以上完成目标有力支撑高质量发展

102项重大工程98%以上完成目标2025-03-03 16:50:07

女子吃了未熟香菇身体像被“鞭打” 警惕香菇皮炎

女子吃了未熟香菇身体像被鞭打2025-03-03 17:02:44

相关新闻

从DeepSeek看AI趋势大模型推动算力革命
在ChatGPT掀起全球AI热潮两年后，大模型领域迎来了一位新星——DeepSeek。凭借高性能、低成本以及完全开源的特点，DeepSeek迅速吸引了公众的目光，成为市场上的“鲶鱼”
2025-02-14 17:24:33从DeepSeek看AI趋势
机构扎堆调研“AI”板块聚焦大模型与算力需求
进入2月份以来，受DeepSeek引发的本地部署大模型等因素驱动，上市公司机构调研的重点转向了AI大模型、AI算力、人形机器人等领域
2025-02-16 13:09:04机构扎堆调研AI板块
清华翟季冬：DeepSeek 百倍算力效能背后的系统革命智者访谈多模态大模型再升级
就在DeepSeek在华尔街和应用下载榜上引起轰动的同时，深度求索公司在除夕夜再次推出了新的产品
2025-02-01 13:13:44清华翟季冬
大模型企业分化算力成买方市场 AI产业迎来转折点
自2024年起，人工智能产业见证了显著的转型期。据统计，截至同年10月9日，共有188个人工智能大模型通过网信办备案，意味着这些模型具备上线提供服务的资格
2024-10-13 02:57:00大模型企业分化
清华光电融合芯片算力是GPU的3000多倍？媒体搞出的大新闻
近年来，人工智能突破引发了高性能GPU需求暴增。GPU生产商英伟达2023年市值增长239.2%，2024年又涨了45.9%，截至2月12日市值达到1.78万亿美元。GPU已经成为全球高科技业界最炙手可热的商品之一，美国商务部还特别针对中国限制GPU性能，连游戏玩家用的RTX 4090都不让卖了。
2024-12-02 14:18:14清华光电融合芯片算力是GPU的3000多倍？媒体搞出的大新闻
联想联合沐曦发布DeepSeek一体机解决方案破解企业算力部署难题
2月5日，联想集团与沐曦股份联合发布了基于DeepSeek大模型的一体机解决方案
2025-02-05 16:24:07联想联合沐曦发布DeepSeek一体机解决方案

今日热点

阿联酋环球铝业公司生产基地受损袭击致严重破坏

大学生熬夜后脑出血致瘫：半年无记忆坚强女孩重新学走路

太原一建筑起火高层为酒店已致1死25伤

重庆辟谣“张飞古道重开” 封闭路段暂未开放

频道热点

主编邮箱
网上不良信息举报电话：010-56177181

关于中华网 | 广告服务 | 联系我们 | 招聘信息 | 版权声明 | 豁免条款 | 友情链接 | 中华网动态
版权所有中华网