DeepSeek推翻两座大山低成本训练引发行业巨变

小大

用微信扫描二维码
分享至好友和朋友圈

关键词：

2025-01-28 09:04:20 虎嗅APP

DeepSeek的压力最终传递到了黄仁勋身上。英伟达美股股价盘前暴跌近11%，市值缩水超过3500亿美元。资本市场开始怀疑，当相对较少的算力也能实现与OpenAI相媲美的模型性能时，高端算力芯片是否正面临新的泡沫。

这种担忧情绪进一步推高了DeepSeek的热度。短短一周内，DeepSeek应用在美区和中国区App Store免费榜上均位列第一，这是首次有AI助手类产品超越ChatGPT登顶美区App Store。由于用户激增，DeepSeek在两天内接连出现服务宕机现象，官方解释称这可能与服务维护和请求限制有关。

新模型DeepSeek R1是引发这场全球用户大讨论的直接原因。R1不仅开源，还免费供全球用户无限调用，打破了大厂间的资本比拼游戏。相比OpenAI在模型上的闭源及付费使用限制，DeepSeek用不到OpenAI十分之一的资源就做出了性能堪比o1的R1。

Meta担心即将发布的Llama 4在性能上可能无法赶上DeepSeek R1。OpenAI CEO奥特曼也感受到了压力，通过发布首个智能体Operator抢热度，并透露即将上线的o3-mini新消息。

DeepSeek R1在数学、代码、自然语言推理等任务上的性能可与OpenAI o1模型正式版媲美。其创新训练方法如R1-Zero路线，直接将强化学习应用于基础模型，无需依赖监督微调和已标注数据。这种方法提高了训练效率，减少了对人工干预的依赖。

DeepSeek R1的成本远低于同类模型。去年12月发布的DeepSeek-V3开源基础模型，性能对标GPT-4o，但训练成本仅为约557.6万美元。相比之下，GPT-4o模型的训练成本约为1亿美元。DeepSeek R1每百万输入tokens的价格为1～4元人民币，每百万输出tokens为16元人民币，而OpenAI o1的运行成本约为其30倍。

DeepSeek R1的成功引发了广泛关注，包括斯坦福大学计算机科学系客座教授吴恩达和微软董事长兼CEO萨提亚·纳德拉在内的多位大佬都对其表示关注。DeepSeek团队主要由年轻人才组成，专注于模型研究而不考虑商业变现。公司选择了一条理想主义路径，只做基础模型研究，不急于商业化。

DeepSeek R1已成为开源社区Hugging Face上下载量最高的大模型之一，下载量超过10万次。Meta AI首席科学家杨立昆认为，这证明开源模型正在超越专有模型。DeepSeek未来计划继续开源旗舰模型，推动开源生态发展。

DeepSeek的成功让一些初创公司转向其API，因为其价格更具吸引力。字节跳动、阿里通义以及智谱、Kimi等团队也在积极研究DeepSeek。雷军甚至挖来了DeepSeek的关键开发者罗福莉，以增强小米的大模型团队。国内大模型公司面临压力，如果不能快速跟进R1级别的模型效果，客户可能会流失。

(责任编辑：张蕾)

关闭

DeepSeek推翻两座大山 低成本训练引发行业巨变

相关新闻

今日热点

频道热点

DeepSeek推翻两座大山低成本训练引发行业巨变