DeepSeek独立发现o1的一些核心思路低成本高性能引热议

小大

用微信扫描二维码
分享至好友和朋友圈

关键词：

2025-02-01 09:07:48 机器之心Pro

春节期间，国内外AI圈都被DeepSeek刷屏。英伟达的股市震荡更是让全世界瞩目。DeepSeek最近发布的两个模型——DeepSeek-V3和DeepSeek-R1以较低成本获得了与OpenAI同类模型相当的性能，这引发了市场对AI硬件需求的担忧，投资者担心未来对英伟达高端芯片的需求可能会减少。

关于DeepSeek技术创新的讨论也非常多。很多人认为，DeepSeek在硬件受限的情况下走出了一条不同于OpenAI等狂堆算力的道路，通过一系列技术创新来减少模型对算力的需求，同时提升性能。这些成就得到了包括Sam Altman在内的AI领军人物的认可。

随后，OpenAI首席研究官Mark Chen发帖表示，DeepSeek确实独立发现了一些OpenAI也在用的核心理念，但这不代表OpenAI在算力上的高投入不合理。他认为外界对成本方面的反应有些过度夸大，并指出拥有预训练和推理两个范式意味着可以在两个维度上优化能力。随着蒸馏研究的成熟，降低成本和提升能力愈发解耦。OpenAI将继续提升低成本提供模型服务的能力，但也会继续专注于其研究路线图，计划在今年带来更多更好的模型。

OpenAI研究科学家Noam Brown也试图弱化外界对OpenAI和DeepSeek的对比，但效果并不明显。Mark Chen提到的“外界对成本方面的反应有些过度夸大”这一点也被广泛讨论。实际上，DeepSeek-V3的成本仅包括正式训练，不包括前期研究、消融实验等费用。

图灵奖得主、Meta AI首席科学家Yann LeCun认为市场对于DeepSeek的成本反应并不合理。他指出，巨额投资主要用于维持AI服务稳定运行，而不是仅仅用于训练模型。随着AI能力增强，维持服务运行的成本会更高，关键在于用户是否愿意为这些增强的功能付费。

不少网友赞同LeCun的观点，认为训练和推理成本更低的AI技术能更快普及，从而创造更大的市场。从这个角度来看，DeepSeek在降低推理成本方面的努力似乎比降低训练成本更为重要。

面对可能即将到来的推理需求激增，OpenAI、Meta等公司都在做相应准备，如OpenAI的“星际之门”项目和Meta的新一年600亿美元的AI投资。2025年，AI市场的竞争依然激烈，DeepSeek在新一年的发展值得关注。

(责任编辑：张蕾)

关闭

DeepSeek独立发现o1的一些核心思路 低成本高性能引热议

相关新闻

今日热点

频道热点

DeepSeek独立发现o1的一些核心思路低成本高性能引热议