DeepSeek“刷屏”硅谷背后中国AI崛起引发恐慌

小大

用微信扫描二维码
分享至好友和朋友圈

关键词：

2025-01-27 08:52:31 每日经济新闻

短短一个月内，中国AI初创公司深度求索（DeepSeek）发布了两款大模型：DeepSeek-V3和DeepSeek-R1。这两款模型成本低廉，性能却与OpenAI相当，引发了硅谷的震动，甚至让Meta内部陷入恐慌，工程师们开始连夜尝试复制DeepSeek的成果。

Scale AI创始人Alexander Wang在采访中表示，DeepSeek在他们的测试中表现最佳，与美国最好的模型相当。他之前曾评价说，DeepSeek-V3是中国科技界带给美国的一个苦涩教训，指出当美国休息时，中国科技界以更低的成本、更快的速度和更强的实力迎头赶上。

中国AI的新进展也引起了国外媒体的关注，他们认为这些新进展为硅谷敲响了警钟。特别是在5000亿美元的“星际之门”计划公布之际，DeepSeek以极低的价格建立了一个突破性的AI模型，且没有使用尖端芯片，这让人们质疑巨额资本投入是否真的是最有效的方法。

一名Meta员工在匿名平台teamblind上发帖称，由于DeepSeek-V3的表现，Meta已经进入恐慌模式。DeepSeek-V3在基准测试中超越了Llama 4，而其训练预算仅为550万美元。Meta工程师们正争分夺秒地分析DeepSeek的技术，试图复制其成果。管理层则因GenAI研发部门的巨额投入感到焦虑，因为一个高管的薪资就超过了整个DeepSeek V3的训练成本。

去年12月27日，DeepSeek推出了开源模型DeepSeek-V3，在聊天机器人竞技场排名第七，在开源模型中排名第一，并被认为是全球前十中性价比最高的模型。今年1月20日，DeepSeek正式开源R1推理模型，允许所有人遵循MIT License蒸馏R1训练其他模型。1月24日，DeepSeek-R1在聊天机器人竞技场综合榜单上排名第三，与顶尖推理模型o1并列。在高难度提示词、代码和数学等技术性领域，DeepSeek-R1表现出色，风格控制方面也与o1并列第一。

著名投资公司A16z的创始人马克·安德森称赞Deepseek-R1是令人惊叹的突破之一，而且还是开源的。诺奖得主、“AI教父”杰弗里·辛顿认为，中国的STEM教育比美国更好，拥有更多受过良好教育的人才，这为AI的发展提供了坚实的基础。尽管美国试图通过限制英伟达芯片来减缓中国的发展，但这只会促使中国加速发展自己的技术。

斯坦福大学和Epoch AI的研究人员预测，到2027年，最大型模型的训练成本将超过10亿美元。但DeepSeek完全不同，它的训练成本并不昂贵，有可能彻底改变训练和推理领域的游戏规则。有投资者甚至认为，美股芯片股的股价也会面临挑战。

最近四天，国外媒体纷纷聚焦DeepSeek，并一致认为中国大模型的新进展为硅谷敲响了警钟。Business Insider报道称，DeepSeek-R1模型秉承开放精神，完全开源，给美国AI玩家带来了麻烦。CNBC邀请Perplexity CEO Aravind Srinivas分析为何DeepSeek会引发人们对美国在AI领域的全球领先地位是否正在缩小的担忧。英国《金融时报》报道，加州大学伯克利分校AI政策研究员Ritwik Gupta指出，中国的系统工程师人才库比美国大得多，能够更便宜地训练和运行模型。

(责任编辑：于浩淙 zx0176)

关闭

DeepSeek“刷屏”硅谷背后 中国AI崛起引发恐慌

相关新闻

今日热点

频道热点

DeepSeek“刷屏”硅谷背后中国AI崛起引发恐慌