中国AI初创公司深度求索(DeepSeek)在短短一个月内发布了两款大模型,分别是DeepSeek-V3和DeepSeek-R1。这两款模型成本低廉,性能却与OpenAI相当,引起了硅谷的震惊,甚至引发了Meta内部的恐慌。工程师们开始连夜尝试复制DeepSeek的成果。
Scale AI创始人Alexander Wang表示,在他们的测试中,DeepSeek的表现最佳,与美国最好的模型相当。他之前还评价说,DeepSeek-V3是中国科技界带给美国的一个苦涩教训,强调中国科技界以更低的成本、更快的速度和更强的实力追赶上来。
中国AI的新进展引起了国外媒体的关注,认为这些新进展为硅谷敲响了警钟。尤其在5000亿美元的“星际之门”计划公布之际,DeepSeek以极低的价格建立了一个突破性的AI模型,且没有使用尖端芯片,这让人们质疑巨额投入是否是最有效的方法。
一名Meta员工在匿名平台teamblind上发帖称,Meta内部因为DeepSeek的模型进入了恐慌模式。DeepSeek-V3在基准测试中已经超越了Llama 4,而DeepSeek仅用550万美元训练预算就达到了这一成就。Meta工程师们正在争分夺秒地分析DeepSeek的技术,试图复制其成果。管理层也为GenAI研发部门的巨额投入感到焦虑。
去年12月27日,DeepSeek推出了开源模型DeepSeek-V3,在聊天机器人竞技场排名第七,在开源模型中排名第一。今年1月20日,DeepSeek正式开源R1推理模型,允许所有人在遵循MIT License的情况下蒸馏R1训练其他模型。1月24日,DeepSeek-R1在聊天机器人竞技场综合榜单上排名第三,与顶尖推理模型o1并列。在高难度提示词、代码和数学等领域,DeepSeek-R1表现优异,位列第一。在风格控制方面,DeepSeek-R1同样表现出色,与o1并列第一。
短短一个月内,中国AI初创公司深度求索(DeepSeek)发布了两款大模型——DeepSeek-V3和DeepSeek-R1
2025-01-26 10:34:01DeepSeek让Meta深陷恐慌短短一个月内,中国AI初创公司深度求索(DeepSeek)发布了两款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:52:31DeepSeek刷屏硅谷背后短短一个月内,中国AI初创公司深度求索(DeepSeek)发布了两款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:21:32DeepSeek大模型强在哪Meta已经批准美国政府机构和国防承包商使用其人工智能模型,此举旨在让公司的技术在美国军事和国家安全事务中发挥关键作用
2024-11-05 11:13:29Meta向美政府和国防承包商开放AI大模型