9月17日,DeepSeek团队的研究论文《DeepSeek-R1》登上了国际权威期刊《自然》的封面。梁文锋担任通讯作者。
该论文首次公开了仅靠强化学习就能激发大模型推理能力的重要成果,这一模型成为全球最受欢迎的开源推理模型,在Hugging Face平台上的下载量超过1090万次。清华大学新闻学院和人工智能学院双聘教授沈阳指出,R1获得《自然》认证是大模型研究领域的一次“制度破局”。
《自然》在社论中高度评价道,几乎所有主流的大模型都未经过独立同行评审,而DeepSeek打破了这一空白。《自然》认为,AI行业中未经证实的说法和炒作已经司空见惯,而DeepSeek所做的工作是迈向透明度和可重复性的一步。
DeepSeek-R1的研究出发点在于解决当时困扰AI行业的一个重大问题:提升大语言模型的推理能力需要依赖人工标注,限制了可扩展性。DeepSeek尝试通过强化学习让模型自我演化发展出推理能力。基于DeepSeek-V3 Base,使用GRPO作为强化学习框架,仅以最终预测结果与真实答案的正确性为奖励信号,构建出DeepSeek-R1-Zero。在此基础上,采用多阶段训练结合RL、拒绝采样和监督微调,开发出DeepSeek-R1,使模型既具备强推理能力,又能更好贴合人类偏好。
DeepSeek于2月14日将论文提交至《自然》,直至7月17日被接收,9月17日正式发布。期间有8位外部专家参与了同行评审,审稿报告与作者回复一并披露。
沈阳教授指出,《自然》的文章从两个层面值得解读。首先是学术史与产业史的交叉点。过去几年,大模型的叙事几乎全由公司新闻稿、博客和技术报告构成。同行评审在AI领域长期被忽视,因为它太慢,不利于抢占叙事制高点。然而,DeepSeek-R1被《自然》认可,重新将AI模型拉回到科学共同体的规训,赋予其与物理学、医学、材料学并列的学术地位,表明AI也能在严格的科学制度下存活。
DeepSeek团队的研究论文登上了国际权威期刊《自然》的封面。这篇论文由梁文锋担任通讯作者,详细介绍了DeepSeek-R1推理模型的训练细节,并回应了之前关于模型蒸馏的质疑
2025-09-20 12:11:19周鸿祎谈DeepSeek论文登Nature封面当我们把镜头对准人形机器人时,可以看到它们在跑道上摔倒后再爬起来,在复杂的有障碍的路面上“盲走”并保持平衡,或在5v5的机器人足球比赛场上完成一次次传球、接球与射门,这些瞬间足够惊艳
2025-09-29 12:06:10清华教授谈人形机器人发展AI初创公司DeepSeek的论文最近登上了《自然》杂志。该公司表示,其强大的AI模型R1的成功并不依赖于模仿其他大型语言模型生成的示例进行训练。这一声明随着R1模型同行评审版本的发布而公布
2025-09-20 12:18:52DeepSeek在自然杂志公布论文DeepSeek团队的研究论文登上了国际权威期刊《自然》的封面,通讯作者为梁文锋。这篇论文详细介绍了DeepSeek-R1推理模型的训练细节,并回应了关于模型蒸馏的质疑
2025-09-18 11:26:12梁文锋论文登上自然封面