注册登录

中华网 china.com

新闻

国内国际社会体育专题军事财经滚动政务冬奥

关于DeepSeek 马斯克评论了两条帖子 AI将无处不在

小大

用微信扫描二维码
分享至好友和朋友圈

关键词：

2025-01-28 22:30:56 新浪财经

马斯克评论称：“有趣的分析。我所见过的最好的。”“AI 将无处不在。”

关于 DeepSeek r1 的真相与细节，该应用在相关 App Store 类别中下载量排名第一，领先于 ChatGPT，并且超过了 Gemini 和 Claude 的表现。从质量角度看，它与 o1 相当，但不及 o3。r1 实现了真正的算法突破，在训练和推理方面都显著提高了效率。FP8 训练、MLA 和多 token 预测都有重要意义。尽管其训练成本仅为 600 万美元，但这数字可能具有误导性。即使硬件架构新颖，值得注意的是他们使用 PCI-Express 进行扩展。

根据技术论文，600 万美元并不包括前期研究和架构、算法及数据消融实验的成本。这意味着只有在实验室已经在前期研究上投入数亿美元并且能够访问更大规模集群的情况下，才能以 600 万美元的成本训练出 r1 质量的模型。DeepSeek 显然拥有远超 2048 个 H800 的算力；早期的一篇论文提到拥有 10000 个 A100 的集群。一个同样聪明的团队不可能仅凭 600 万美元就能启动 2000 个 GPU 集群并从头开始训练 r1。大约 20% 的 Nvidia 收入来自新加坡，但 20% 的 Nvidia GPU 可能并不在新加坡。存在大量的知识蒸馏，如果没有对 GPT-4o 和 o1 的无障碍访问，他们可能无法完成这个训练。限制前沿 GPU 的访问权限却不对中国蒸馏美国前沿模型的能力采取任何措施，这显然违背了出口限制的目的。

DeepSeek r1 确实具有重要意义，尤其在推理成本上比 o1 低得多且效率更高，这比 600 万美元的训练成本更具意义。r1 的每次 API 调用成本比 o1 低 93%，可以在高端工作站上本地运行，而且似乎没有遇到任何速率限制。简单计算一下，每 10 亿个活跃参数在 FP8 下需要 1GB 的 RAM，因此 r1 需要 37GB 的 RAM。批处理大大降低了成本，更多的计算能力增加了每秒 token 数，所以云端推理仍然具有优势。这里还存在真正的地缘政治动态，“Stargate”之后发布并非巧合。

12 全文共 2 页下一页

关闭

乌方将不承认美俄谈判达成的协议泽连斯基坚决立场

乌方将不承认美俄谈判达成的协议2025-02-18 13:52:32

未来三天南方阴雨湿冷感明显北方降水增多

未来三天南方阴雨湿冷感明显2025-02-18 13:52:04

武汉一培训机构请千名学生看哪吒2 放松身心缓解压力

武汉一培训机构请千名学生看哪吒22025-02-18 13:50:19

以民众持续抗议要求政府维持停火呼吁释放被扣押人员

以民众持续抗议要求政府维持停火2025-02-18 13:44:58

伊朗：反对外国势力干涉叙利亚支持叙人民自决权

伊朗,反对外国势力干涉叙利亚2025-02-18 13:33:51

章昊直播时模仿徐冬冬姿势

章昊模仿徐冬冬姿势2025-02-18 13:34:13

三亚招募100名旅游体验官提升服务质量与游客满意度

三亚招募100名旅游体验官2025-02-18 13:49:55

大V：欧洲和乌克兰遭受三次沉重打击西方暴露三大问题

大V,欧洲和乌克兰遭受三次沉重打击2025-02-18 13:13:27

武汉一培训机构请千名学生看哪吒2 放松身心缓解压力

武汉一培训机构请千名学生看哪吒22025-02-18 13:50:19

乌方将不承认美俄谈判达成的协议泽连斯基坚决立场

乌方将不承认美俄谈判达成的协议2025-02-18 13:52:32

泽连斯基将到访沙特不参与美俄会谈

泽连斯基将到访沙特2025-02-18 13:34:14

未来三天南方阴雨湿冷感明显北方降水增多

未来三天南方阴雨湿冷感明显2025-02-18 13:52:04

马斯克坐实AI游戏工作室计划让游戏再次伟大

马斯克坐实AI游戏工作室计划2025-02-18 13:19:44

网红高收入合理吗？顾茜茜称每天躺赚30万是气话

网红高收入合理吗2025-02-18 13:45:21

媒体批特朗普又一次“抢劫”台湾美国的真实意图暴露

媒体批特朗普又一次抢劫台湾2025-02-18 13:15:58

陈晓陈妍希今后各自安好感恩遇见共伴成长

陈晓陈妍希今后各自安好2025-02-18 13:36:18

光线传媒再度巨震高位人气股走弱

光线传媒再度巨震2025-02-18 13:45:40

特朗普批波音总统专机还没造好项目拖延引不满

特朗普批波音总统专机还没造好2025-02-18 13:31:20

安徽一车坠河4人遇难事故仍在调查处理中

安徽一车坠河4人遇难2025-02-18 13:38:27

曾被雷军千万年薪挖角！亲属称罗福莉与丈夫研究领域相同

亲属称罗福莉与丈夫研究领域相同2025-02-18 13:11:57

欧洲的安全，还是美国的利益？美俄谈判前夕，欧洲被边缘化引发担忧

欧洲的安全还是美国的利益吗2025-02-18 13:48:41

美国翻脸后，欧洲从“夸夸其谈的少年”走向独立成熟要做三件事应对三大危机

美国翻脸后,欧洲从夸夸其谈的少年走向独立成熟要做三件事2025-02-18 13:29:52

波兰外长：在黄油和枪炮间很难选择欧洲需加强国防开支

波兰外长,在黄油和枪炮间很难选择2025-02-18 13:33:55

赖志光任广东惠州公安局局长新任副市长兼公安局长

赖志光任广东惠州公安局局长2025-02-18 13:43:08

马斯克查账“美国社保”，称发现360岁老人？

马斯克查账“美国社保”，称发现360岁老人？2025-02-18 13:45:10

美为何提议从中国向乌派遣维和人员美国的奇葩主意

美为何提议从中国向乌派遣维和人员2025-02-18 13:14:02

网曝河北邢台一局长酒后砸店伤人当地纪委介入调查

局长酒后砸店伤人纪委介入调查2025-02-18 13:40:15

美国新版“空军一号”再度延期交付供应链问题拖累进度

美国新版空军一号再度延期交付2025-02-18 13:51:02

哪吒2主创团队已进入新创作周期续写神话新篇章

哪吒2主创团队已进入新创作周期2025-02-18 13:47:55

暴雪《守望先锋》国服明日回归！中国主题四大天王皮肤来了国服专属福利揭晓

暴雪守望先锋国服明日回归,中国主题四大天王皮肤来了2025-02-18 13:34:36

申公豹的结巴能矫正吗口吃并非无法改善

申公豹的结巴能矫正吗2025-02-18 13:43:25

为了增加军费，英国公共服务部门被曝准备削减11%的预算，欧洲派兵计划陷入僵局

为了增加军费，英国公共服务部门被曝准备削减11%的预算2025-02-18 13:50:26

美俄谈判今日开始泽连斯基：不承认乌克兰缺席引发争议

美俄谈判今日开始泽连斯基,不承认2025-02-18 13:20:24

拉夫罗夫抵达沙特单手揣兜下飞机谈判桌上的博弈

拉夫罗夫抵达沙特单手揣兜下飞机2025-02-18 13:13:44

美客机翻覆现场视频曝光恶劣天气或成事故主因

美客机翻覆现场视频曝光2025-02-18 13:20:05

相关新闻

马斯克谈DeepSeek xAI即将发布更强模型
DeepSeek 火了，全球出现了 2000 多个假冒网站，其中 60% 的 IP 在美国。这些假冒域名被用于钓鱼诈骗、域名抢注和流量劫持。从创建时间来看，冒名 IP 域名的注册数量从 1 月 27 日开始激增，随后从 2 月初逐渐减少
2025-02-09 22:13:58马斯克谈DeepSeek
杨华评论：关于中国足球的集体反思都是盲人摸象
中国足球的广泛讨论激发了各界的深刻反思，就连平日里不太关注足球的人们也加入了这场灵魂探索。回顾1993年国足在伊尔比德的挫败后，足协曾组织大型研讨会探讨中国足球的未来，遗憾的是，时至今日，这一问题依旧悬而未解
2024-09-14 15:36:57杨华评论：关于中国足球的集体反思都是盲人摸象
马斯克评论中国机器狗产品未来战争新趋势
近日，中国机器人创业公司宇树科技发布了最新机器狗产品B2-W的演示视频，引起了全球关注。许多国外网友表示被中国的科技实力震撼
2024-12-29 13:21:43马斯克评论中国机器狗产品
OpenAI前研究员自杀马斯克评论引发行业震动
美国消费者新闻与商业频道（CNBC）报道，26岁的前OpenAI研究员苏奇尔·巴拉吉近期被发现在旧金山的公寓内自杀身亡。这一消息得到了OpenAI发言人的证实，旧金山首席法医办公室执行主任大卫·塞拉诺·休厄尔也在邮件中确认了死因为自杀
2024-12-14 18:46:24OpenAI前研究员自杀马斯克评论
马斯克为何成DeepSeek“头号黑粉” 小力出奇迹的挑战者
马斯克的“仇人”名单上最近新增了中国AI创业公司DeepSeek。过去一个月，这家以少量资源开发出顶级性能R1开源大模型的公司持续受到全球关注
2025-01-31 13:48:55马斯克为何成DeepSeek头号黑粉
马斯克评论美国24年来最严重空难质疑FAA雇佣政策
当地时间周三晚，一架美国航空公司的支线飞机与一架美国陆军的黑鹰直升机在华盛顿特区上空相撞，导致客机上的64人和直升机上的3名军人全部遇难。这是自2001年11月以来美国发生的最严重的空难
2025-01-31 13:46:59马斯克评论美国24年来最严重空难

今日热点

哥伦比亚军机坠毁致69人遇难事故原因待查

救命神器AED使用率不足0.1% 认知与培训仍是短板

AED能救回将猝死的人吗防猝死需持续突围

张雪峰曾为多睡一会儿住酒店生命警示录

频道热点

主编邮箱
网上不良信息举报电话：010-56177181

关于中华网 | 广告服务 | 联系我们 | 招聘信息 | 版权声明 | 豁免条款 | 友情链接 | 中华网动态
版权所有中华网