注册登录

中华网 china.com

新闻

国内国际社会体育专题军事财经滚动政务冬奥

DeepSeek新模型火到海外开源大模型正超越闭源

小大

用微信扫描二维码
分享至好友和朋友圈

关键词：

2025-01-27 18:38:01 新浪财经

DeepSeek上周发布了开源模型DeepSeek-R1，并声称其性能可以与OpenAI的o1正式版相媲美，这一消息在海外AI业界引发了广泛讨论。焦点在于，当开源模型的能力达到甚至超越最新的闭源模型时，可能会改变整个大模型的竞争格局。

根据DeepSeek的介绍，DeepSeek-R1在Codeforces、GPQA Diamond、MATH-500、MMLU、SWE-bench Verified等测试中的得分接近或超过o1正式版。该模型在后训练阶段大规模应用了强化学习技术，在仅有少量标注数据的情况下显著提升了推理能力。

Meta首席AI科学家Yann Lecun认为，DeepSeek-R1的发布意味着开源大模型正在超越闭源模型，而不是单纯地表明中国公司在AI领域超越美国公司。他表示，DeepSeek将从开放研究和开源中受益，类似于Meta的PyTorch和Llama。通过提出新想法并在他人工作的基础上进行实现，由于这些工作是公开和开源的，每个人都能从中获益，这就是开放研究和开源的力量。

(责任编辑：张佳鑫 0764)

关闭

“一二三四五......”司机见中草药包变10万现金惊住了

司机见中草药包变10万现金惊住了2025-02-18 14:03:11

陈晓陈妍希情史回顾九年婚姻终落幕

陈晓陈妍希情史回顾2025-02-18 14:02:09

中国导演20万美元拍出北美短剧第一刷新票房纪录

中国导演20万美元拍出北美短剧第一2025-02-18 14:01:37

为了增加军费，英国公共服务部门被曝准备削减11%的预算，欧洲派兵计划陷入僵局

为了增加军费，英国公共服务部门被曝准备削减11%的预算2025-02-18 13:50:26

张睿发寻物启事找眼镜，张睿没眼镜上不了课

张睿发寻物启事找眼镜2025-02-18 13:54:41

“一二三四五......”司机见中草药包变10万现金惊住了

司机见中草药包变10万现金惊住了2025-02-18 14:03:11

武汉一培训机构请千名学生看哪吒2 放松身心缓解压力

武汉一培训机构请千名学生看哪吒22025-02-18 13:50:19

曝王大陆涉嫌逃兵役被捕

曝王大陆涉嫌逃兵役被捕,王大陆被捕2025-02-18 13:57:04

今日雨水节气，老传统“吃二样，做二事，忌二事” 千年习俗的智慧

今日雨水节气,老传统吃二样,做二事,忌二事2025-02-18 13:55:02

特朗普批波音总统专机还没造好项目拖延引不满

特朗普批波音总统专机还没造好2025-02-18 13:31:20

哈萨克斯坦铀出口重心东移哈铀售中俄后致欧美快断供了

哈铀售中俄后致欧美快断供了2025-02-18 13:53:48

马斯克坐实AI游戏工作室计划让游戏再次伟大

马斯克坐实AI游戏工作室计划2025-02-18 13:19:44

未来三天南方阴雨湿冷感明显北方降水增多

未来三天南方阴雨湿冷感明显2025-02-18 13:52:04

陈晓陈妍希情史回顾九年婚姻终落幕

陈晓陈妍希情史回顾2025-02-18 14:02:09

欧洲的安全，还是美国的利益？美俄谈判前夕，欧洲被边缘化引发担忧

欧洲的安全还是美国的利益吗2025-02-18 13:48:41

马斯克查账“美国社保”，称发现360岁老人？

马斯克查账“美国社保”，称发现360岁老人？2025-02-18 13:45:10

私家车占人行道家长担忧孩子走车道社区回应：将安装U型杆或石球

私家车占人行道家长担忧孩子走车道2025-02-18 13:59:27

大V：欧洲和乌克兰遭受三次沉重打击西方暴露三大问题

大V,欧洲和乌克兰遭受三次沉重打击2025-02-18 13:13:27

哪吒2主创团队已进入新创作周期续写神话新篇章

哪吒2主创团队已进入新创作周期2025-02-18 13:47:55

美航司客机事故乘客拍下逃生瞬间加拿大：事发时风力强劲

美航司客机事故乘客发声2025-02-18 14:00:03

美客机翻覆现场视频曝光恶劣天气或成事故主因

美客机翻覆现场视频曝光2025-02-18 13:20:05

观察：2025年的Mini LED电视市场，怎么打？三大竞争焦点浮现

观察,2025年的MiniLED电视市场,怎么打2025-02-18 13:57:25

拉夫罗夫抵达沙特单手揣兜下飞机谈判桌上的博弈

拉夫罗夫抵达沙特单手揣兜下飞机2025-02-18 13:13:44

伊朗：反对外国势力干涉叙利亚支持叙人民自决权

伊朗,反对外国势力干涉叙利亚2025-02-18 13:33:51

黑中介骗取巨额服务费被公诉虚假承诺诱骗客户

黑中介骗取巨额服务费被公诉2025-02-18 13:54:23

美俄谈判今日开始泽连斯基：不承认乌克兰缺席引发争议

美俄谈判今日开始泽连斯基,不承认2025-02-18 13:20:24

美国翻脸后，欧洲从“夸夸其谈的少年”走向独立成熟要做三件事应对三大危机

美国翻脸后,欧洲从夸夸其谈的少年走向独立成熟要做三件事2025-02-18 13:29:52

中国导演20万美元拍出北美短剧第一刷新票房纪录

中国导演20万美元拍出北美短剧第一2025-02-18 14:01:37

媒体批特朗普又一次“抢劫”台湾美国的真实意图暴露

媒体批特朗普又一次抢劫台湾2025-02-18 13:15:58

美为何提议从中国向乌派遣维和人员美国的奇葩主意

美为何提议从中国向乌派遣维和人员2025-02-18 13:14:02

泽连斯基将到访沙特不参与美俄会谈

泽连斯基将到访沙特2025-02-18 13:34:14

美国新版“空军一号”再度延期交付供应链问题拖累进度

美国新版空军一号再度延期交付2025-02-18 13:51:02

金价连涨7周后“跳水” 金店再现买金热

金价连涨7周后跳水2025-02-18 14:00:44

三亚招募100名旅游体验官提升服务质量与游客满意度

三亚招募100名旅游体验官2025-02-18 13:49:55

乌方将不承认美俄谈判达成的协议泽连斯基坚决立场

乌方将不承认美俄谈判达成的协议2025-02-18 13:52:32

相关新闻

DeepSeek新模型“火”到海外引发硅谷恐慌
短短一个月内，中国AI初创公司深度求索（DeepSeek）发布了两款大模型：DeepSeek-V3和DeepSeek-R1
2025-01-26 15:51:02DeepSeek新模型火到海外
DeepSeek发布新模型 Janus-Pro超越DALL-E 3
DeepSeek发布了新款开源多模态AI模型Janus-Pro。该模型在GenEval和DPG-Bench基准测试中表现优异，超越了OpenAI的DALL-E 3和Stable Diffusion
2025-01-28 09:17:49DeepSeek发布新模型
阿里新模型声称超越DeepSeek 展现领先性能
阿里云通义千问超大规模的MoE模型Qwen2.5-Max于1月29日凌晨正式上线。该模型是阿里云通义团队对MoE模型的最新成果，预训练数据超过20万亿tokens
2025-01-30 13:16:20阿里新模型声称超越DeepSeek
364元就能开发DeepSeek模型？假的 AI领域新警钟
近日，一则关于AI的新闻在全球范围内引起了广泛关注。斯坦福大学和华盛顿大学的研究人员发表了一篇论文，展示了他们以不到50美元（约364元）的云计算费用训练出的一款名为S1的推理模型
2025-02-08 09:05:58364元就能开发DeepSeek模型
DeepSeek再发布新模型 Janus-Pro显著提升多模态能力
1月28日凌晨，人工智能社区Hugging Face上发布了开源多模态AI模型Janus-Pro。作为Janus的高级版本，Janus-Pro采用了优化的训练策略，扩展了训练数据，并且拥有更大的模型规模
2025-01-29 07:32:49DeepSeek再发布新模型
DeepSeek文生图新模型优于OpenAI 技术突破引发关注
北京时间1月28日凌晨，农历新年前夕，中国人工智能初创公司DeepSeek在GitHub和Hugging Face上发布了多模态大模型Janus-Pro，进军文生图领域
2025-01-29 04:29:50DeepSeek文生图新模型优于OpenAI

今日热点

凶宅价格低于市场价20%至30% 6步揭秘凶宅交易链

20人老头乐工厂称已与小米汽车和解专利风波落幕

大众回应斯柯达将退出中国销售持续至2026年中

【村民搬家时发现91年前红军借据村民说要把红军留下的借据代代相传

频道热点

主编邮箱
网上不良信息举报电话：010-56177181

关于中华网 | 广告服务 | 联系我们 | 招聘信息 | 版权声明 | 豁免条款 | 友情链接 | 中华网动态
版权所有中华网