证券时报的文章内容仅供参考,不构成实质性投资建议,据此操作风险自担。下载“证券时报”官方APP或关注官方微信公众号,可以随时了解股市动态,洞察政策信息,把握财富机会。
9月18日,DeepSeek团队的研究论文《DeepSeek-R1推理模型》登上了国际权威期刊《自然》的封面。梁文锋担任该论文的通讯作者。DeepSeek R1是首个通过同行评议的主要大语言模型,新版论文与今年1月未经同行评审的初版有较大差异。
在同行评议过程中,DeepSeek团队减少了对模型的拟人化描述,并增加了技术细节说明,包括训练数据类型和安全性考虑等,回应了关于知识蒸馏的质疑。DeepSeek否认了使用OpenAI模型输出进行训练的说法,明确表示DeepSeek-V3 Base(DeepSeek-R1的基座模型)使用的数据全部来自互联网,虽然可能包含GPT-4生成的结果,但绝非有意而为之,更没有专门的蒸馏环节。为防止基准测试数据污染,团队对DeepSeek-R1的预训练和后训练数据都实施了全面的去污染措施。
开源之后,R1在Hugging Face上的下载量突破1090万次,成为全球最受欢迎的开源推理模型之一。DeepSeek首次公开了仅靠强化学习就能激发大模型推理能力的重要研究成果,启发了全球AI研究者。R1的核心创新在于采用了“纯强化学习”这一自动化试错方法,通过奖励模型达到正确答案的行为来学习推理策略,而非传统模仿人类预设的推理模式。补充材料中还首次公布了R1训练成本仅为29.4万美元,加上约600万美元的基础模型成本,远低于其他主流AI公司的训练成本。
今年1月,DeepSeek R1模型发布时,其卓越的推理能力和极低的开发成本曾引发全球科技股大幅下跌。作为全球首个通过同行评审的主流大语言模型,《自然》期刊将该篇论文作为封面论文,并在评论报道文章中表达了赞赏和肯定,认为这标志着中国在大模型基础研究领域取得重要突破。在AI行业快速发展中,未经证实的说法和炒作不在少数。《自然》杂志认为,依靠独立研究人员进行的同行评审是抑制AI行业过度炒作的有效方式。DeepSeek所做的一切,是非常值得欢迎的先例。
8月21日,DeepSeek正式发布了最新大语言模型DeepSeek-V3.1。新升级版本的变化主要体现在三个方面:混合推理架构、更高的思考效率以及更强的Agent能力。DeepSeek-V3.1实现了一个模型同时支持思考模式与非思考模式。DeepSeek是2023年成立于杭州的人工智能公司,由幻方量化孵化,创始团队由梁文锋领衔,成员来自顶尖高校与国际机构的技术专家。
记者16日从中国科学院昆明植物研究所获悉,该所团队在云南发现了四个真菌新物种,分别命名为:哀牢绿杯菌、版纳绿杯菌、老君绿杯菌和玉龙绿杯菌。这项成果于近期发表在了国际期刊《真菌学进展》上
2025-04-17 08:43:55云南发现四个真菌新种韦东奕,北京大学数学科学学院助理教授、研究员,近日开通个人社交账号,吸引了大量网民关注
2025-06-11 19:38:33韦东奕舆论喧嚣之外专注学术韦东奕,北京大学数学科学学院助理教授、研究员,最近开通了个人社交账号,吸引了众多网民的关注
2025-06-11 00:33:28韦东奕舆论喧嚣之外其实专注学术在4月18日的国务院新闻办新闻发布会上,中国工业和信息化部信息通信发展司司长谢存透露,中国各方正在共同努力推进6G创新,已发布《6G总体愿景与潜在关键技术》等50余项研究成果
2025-04-19 11:06:39中国已发布50余项6G研究成果人到中年,是人生承上启下的关键阶段,也是压力与挑战并存的时期。根据普遍的社会观察和心理研究,以下是这个阶段较为深切的“痛点”:身体机能明显下降,慢性病初现(如三高、关节问题等),恢复能力变差
2025-08-18 15:38:28DeepSeek正在遭遇中年危机