坚持长期视角,专注底层创新,探索新的路径。一家此前不被多数媒体关注的“小企业”,走开源路线而非闭源或率先开发应用,却在2025年开年成为中国大模型领域科技创新的全球代表。
这家名为DeepSeek(深度求索)的中国大模型企业,最近发布的大模型在多项性能测试中达到了OpenAI最新大模型o1的水平,部分项目甚至实现了超越。这引发了全球科技行业的热烈讨论,有媒体形容“DeepSeek朝硅谷‘开了一枪’”,甚至“震动美国科技界”。
DeepSeek的成功主要体现在两方面。首先是其算力成本投入与表现出来的性能对比超出了行业的一般认知。据媒体报道,DeepSeek r1的训练成本仅为ChatGPT o1的零头。其次是DeepSeek证明了开源路线的逆袭胜利,对大公司、巨头的闭源路线进行了一次颠覆。
然而,这些看法在社交平台上广泛讨论后,出现了一些扭曲。例如,DeepSeek r1的真实算力成本远不止600万美元,最早报道的媒体混淆了论文中的数据。事实上,550万美元是DeepSeek v3在正式训练阶段的成本,不包括前期研究和实验的成本。从行业发展的逻辑来看,探索与迭代、追赶所需的算力成本不应简单对比。创新和探索必然伴随着算力和各项成本的浪费,在确定性路径上的优化所付出的代价与探索未知所付出的代价不宜直接比较。
现阶段大模型的发展还不能定义为闭源与开源路线的成败。更严谨地看待DeepSeek带给我们的惊喜,应该是:它展示了模型架构底层创新的价值,提升了算力效率,并推动了开源大模型产品在能力上的超越,从而进一步提升行业整体的应用研发水平。
在人工智能领域,一场激烈的竞争正在上演。去年12月,国内大模型公司“深度求索”开发的DeepSeek应用推出了DeepSeek-V3,在全球AI领域引起了巨大反响
2025-01-28 21:51:57DeepSeek小力出奇迹一位正值青春的高三学生肖雨,在疫情笼罩下承受着巨大的学习与生活压力,选择了一个假期回家休息。尽管父母尽力营造温馨的家庭氛围,试图缓解她的紧张情绪,但肖雨的内心依旧充满焦虑
2024-10-11 14:09:25抑郁症少女签署器官捐赠协议健康是全球人类的共同愿望,新中国历经75年的努力,实现了公共卫生领域的巨大进步。人均预期寿命从1949年的35岁显著提升至2023年的78.6岁,足足增长了一倍多
2024-10-07 16:11:0035岁78.6岁