春节期间,国内外AI圈都被DeepSeek刷屏。英伟达的股市震荡更是让全世界瞩目。DeepSeek最近发布的两个模型——DeepSeek-V3和DeepSeek-R1以较低成本获得了与OpenAI同类模型相当的性能,这引发了市场对AI硬件需求的担忧,投资者担心未来对英伟达高端芯片的需求可能会减少。
关于DeepSeek技术创新的讨论也非常多。很多人认为,DeepSeek在硬件受限的情况下走出了一条不同于OpenAI等狂堆算力的道路,通过一系列技术创新来减少模型对算力的需求,同时提升性能。这些成就得到了包括Sam Altman在内的AI领军人物的认可。
随后,OpenAI首席研究官Mark Chen发帖表示,DeepSeek确实独立发现了一些OpenAI也在用的核心理念,但这不代表OpenAI在算力上的高投入不合理。他认为外界对成本方面的反应有些过度夸大,并指出拥有预训练和推理两个范式意味着可以在两个维度上优化能力。随着蒸馏研究的成熟,降低成本和提升能力愈发解耦。OpenAI将继续提升低成本提供模型服务的能力,但也会继续专注于其研究路线图,计划在今年带来更多更好的模型。
OpenAI研究科学家Noam Brown也试图弱化外界对OpenAI和DeepSeek的对比,但效果并不明显。Mark Chen提到的“外界对成本方面的反应有些过度夸大”这一点也被广泛讨论。实际上,DeepSeek-V3的成本仅包括正式训练,不包括前期研究、消融实验等费用。
图灵奖得主、Meta AI首席科学家Yann LeCun认为市场对于DeepSeek的成本反应并不合理。他指出,巨额投资主要用于维持AI服务稳定运行,而不是仅仅用于训练模型。随着AI能力增强,维持服务运行的成本会更高,关键在于用户是否愿意为这些增强的功能付费。
不少网友赞同LeCun的观点,认为训练和推理成本更低的AI技术能更快普及,从而创造更大的市场。从这个角度来看,DeepSeek在降低推理成本方面的努力似乎比降低训练成本更为重要。
面对可能即将到来的推理需求激增,OpenAI、Meta等公司都在做相应准备,如OpenAI的“星际之门”项目和Meta的新一年600亿美元的AI投资。2025年,AI市场的竞争依然激烈,DeepSeek在新一年的发展值得关注。
近日,DeepSeek的爆火引发了广泛关注。其中,VC们集体错过投资DeepSeek成为大众讨论的热点。百度风投作为DeepSeek楼上的投资机构,也因未能投资而引发网友热议
2025-02-09 18:06:37错过投资DeepSeek国产AI公司深度求索(DeepSeek)的出现不仅吸引了科技界的关注,也引起了资本市场的兴趣,并且持续扩展其影响力
2025-02-10 09:15:30券商晨会精华北京时间周五凌晨,OpenAI举办了“12天12场直播”活动的首场直播,推出了推理大模型o1的完整版本和进阶模式,以及每月收费200美元(约合人民币1450元)的ChatGPT Pro订阅服务
2024-12-06 09:28:30OpenAI上线满血版o1大模型9月12日,OpenAI在其官网上发布了一则公告,宣布向所有订阅用户推出OpenAI o1预览模型。这一模型被公众广泛关注,昵称为“草莓”大模型
2024-09-13 08:15:59OpenAI发布具有推理能力的AI模型o1