2025年1月中旬,英伟达CEO黄仁勋访问中国,从北京到深圳,再到台中和上海,引起广泛关注。然而,在距离英伟达上海办公室仅200公里的杭州,一家名为深度求索(DeepSeek)的中国公司正在悄然酝酿一场足以撼动AI产业格局的风暴。1月20日,DeepSeek开源了推理模型DeepSeek-R1,这一事件迅速引起了全球关注,导致英伟达市值一周内蒸发了5520亿美元。
DeepSeek的崛起主要得益于其在性能、价格和开源方面的三重冲击。1月24日发布的聊天机器人竞技场榜单上,DeepSeek-R1综合排名第三,与OpenAI的ChatGPT并列,并在高难度提示词、代码和数学等领域位列第一。DeepSeek-R1的价格低得惊人,仅为竞争对手的2%~3%,且完全免费提供移动应用和网页端服务。此外,DeepSeek-R1完全开源,任何人都可以自由使用、修改、分发和商业化该模型。
著名投资公司A16z的创始人马克·安德森认为,Deepseek-R1是令人惊叹的突破之一,而且还是开源的,堪称给世界的一份礼物。Scale AI创始人亚历山大·王表示,DeepSeek的发布可能会改变中美在AI竞赛中的局势。
华尔街对此感到焦虑,投资者开始质疑巨头们在算力上的投入是否值得。投行Jeffreies股票分析师Edison Lee团队指出,美国AI企业的管理层可能面临更大的压力,需要回答进一步提高AI资本支出是否合理的问题。摩根大通分析师Joshua Meyers则认为,DeepSeek的低成本并不意味着扩张的终结,也不意味着不再需要更多的算力。
DeepSeek的成功部分归功于数据蒸馏技术,但这一技术在行业内存在争议。南洋理工大学研究人员王汉卿表示,被训练的模型无法真正超越“教师模型”。不过,DeepSeek-V3的创新不仅于此,其精简有效的架构和自主提出的MLA机制也降低了缓存使用。
今年春节,一款名为DeepSeek R1的中国大模型在全球AI圈引起了广泛关注。这款模型直接对标了OpenAI去年9月发布的OpenAI o1系列模型
2025-02-10 14:32:11DeepSeek撼动AI生态游戏规则2月5日,A股在农历新年后的首个交易日开盘,DeepSeek概念股继续大涨。每日互动、青云科技、安恒信息、安凯微、天娱数科、三六零等多股开盘即涨停。DeepSeek正在引发全球AI开源技术的变革
2025-02-06 09:08:44DeepSeek引发多国政府审查过去一周,中国的人工智能大模型成为硅谷乃至全球科技界的热议话题。引发这场讨论的是中国人工智能初创公司深度求索(DeepSeek)
2025-01-27 10:02:46幻方DeepSeek如何震惊硅谷