短短一个月内,中国AI初创公司深度求索(DeepSeek)发布了两款大模型:DeepSeek-V3和DeepSeek-R1。这两款模型成本低廉,性能却与OpenAI相当,引发了硅谷的震动,甚至让Meta内部陷入恐慌,工程师们开始连夜尝试复制DeepSeek的成果。
Scale AI创始人Alexander Wang在采访中表示,DeepSeek在他们的测试中表现最佳,与美国最好的模型相当。他之前曾评价说,DeepSeek-V3是中国科技界带给美国的一个苦涩教训,指出当美国休息时,中国科技界以更低的成本、更快的速度和更强的实力迎头赶上。
中国AI的新进展也引起了国外媒体的关注,他们认为这些新进展为硅谷敲响了警钟。特别是在5000亿美元的“星际之门”计划公布之际,DeepSeek以极低的价格建立了一个突破性的AI模型,且没有使用尖端芯片,这让人们质疑巨额资本投入是否真的是最有效的方法。
一名Meta员工在匿名平台teamblind上发帖称,由于DeepSeek-V3的表现,Meta已经进入恐慌模式。DeepSeek-V3在基准测试中超越了Llama 4,而其训练预算仅为550万美元。Meta工程师们正争分夺秒地分析DeepSeek的技术,试图复制其成果。管理层则因GenAI研发部门的巨额投入感到焦虑,因为一个高管的薪资就超过了整个DeepSeek V3的训练成本。
去年12月27日,DeepSeek推出了开源模型DeepSeek-V3,在聊天机器人竞技场排名第七,在开源模型中排名第一,并被认为是全球前十中性价比最高的模型。今年1月20日,DeepSeek正式开源R1推理模型,允许所有人遵循MIT License蒸馏R1训练其他模型。1月24日,DeepSeek-R1在聊天机器人竞技场综合榜单上排名第三,与顶尖推理模型o1并列。在高难度提示词、代码和数学等技术性领域,DeepSeek-R1表现出色,风格控制方面也与o1并列第一。
著名投资公司A16z的创始人马克·安德森称赞Deepseek-R1是令人惊叹的突破之一,而且还是开源的。诺奖得主、“AI教父”杰弗里·辛顿认为,中国的STEM教育比美国更好,拥有更多受过良好教育的人才,这为AI的发展提供了坚实的基础。尽管美国试图通过限制英伟达芯片来减缓中国的发展,但这只会促使中国加速发展自己的技术。
斯坦福大学和Epoch AI的研究人员预测,到2027年,最大型模型的训练成本将超过10亿美元。但DeepSeek完全不同,它的训练成本并不昂贵,有可能彻底改变训练和推理领域的游戏规则。有投资者甚至认为,美股芯片股的股价也会面临挑战。
最近四天,国外媒体纷纷聚焦DeepSeek,并一致认为中国大模型的新进展为硅谷敲响了警钟。Business Insider报道称,DeepSeek-R1模型秉承开放精神,完全开源,给美国AI玩家带来了麻烦。CNBC邀请Perplexity CEO Aravind Srinivas分析为何DeepSeek会引发人们对美国在AI领域的全球领先地位是否正在缩小的担忧。英国《金融时报》报道,加州大学伯克利分校AI政策研究员Ritwik Gupta指出,中国的系统工程师人才库比美国大得多,能够更便宜地训练和运行模型。
短短一个月内,中国AI初创公司深度求索(DeepSeek)发布了两款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:21:32DeepSeek大模型强在哪白头鹰再次针对一家小公司采取行动,使用的依旧是那些熟悉的手段。近期,一家初创公司推出的DeepSeek软件在全球范围内引起轰动,在160多个国家的AI软件下载排行榜上位居榜首
2025-02-04 19:33:47DeepSeek美股泡沫得以延续短短一个月内,中国AI初创公司深度求索(DeepSeek)发布了两款大模型——DeepSeek-V3和DeepSeek-R1
2025-01-26 10:34:01DeepSeek让Meta深陷恐慌中国国产大模型Deepseek在硅谷引起了轰动。从斯坦福到麻省理工,Deepseek R1几乎一夜之间成为美国顶尖大学研究人员的首选模型
2025-01-27 15:33:19媒体揭秘国产大模型DeepSeek今年春节,国产大模型DeepSeek在全球范围内迅速走红。短短一周内,该应用不仅登上了美国和中国区App Store免费榜的榜首,还成为首个超越OpenAI ChatGPT的AI助手类应用
2025-02-12 15:41:17DeepSeek刷屏全球