近期,中国人工智能公司深度求索(DeepSeek)开发的AI模型引起了西方业界的高度关注。各大西方媒体、AI团队及投资者纷纷探讨,在缺乏顶尖芯片的情况下,中国如何以更低的成本创造出能与美国顶尖AI模型相媲美的产品。
美国消费者新闻与商业频道(CNBC)报道指出,深度求索发布的AI模型不仅性能超越美国同类模型,而且构建成本更低,所用芯片算力也较弱。这一消息在硅谷引发恐慌,让美国人开始质疑美国在全球人工智能领域的领先地位是否正在缩小,以及科技巨头在构建人工智能模型和数据中心上的巨额投入是否值得。
去年12月底,深度求索推出了一款免费开源的大语言模型DeepSeek-V3。该模型仅用了两个月时间,花费不到600万美元,使用英伟达H800芯片构建而成。相比之下,谷歌和OpenAI则花费了数年时间和数亿美元才取得类似成果。DeepSeek的开源模型已成为许多美国开发者的基础。
在一系列第三方基准测试中,深度求索的模型在解决复杂问题、数学和编程等方面表现优于Meta的Llama 3.1、OpenAI的GPT-4和Anthropic的Claude Sonnet 3.5。其最新发布的推理模型DeepSeek-R1同样超越了OpenAI的最新模型o1。
微软首席执行官萨蒂亚·纳德拉在达沃斯世界经济论坛上表示,深度求索的新模型令人印象深刻,他们高效地开发出一款开源模型,在推理计算方面表现出色,计算效率极高。这些进展需要被严肃对待。
值得注意的是,这些成就是在美国政府对中国实施严格半导体限制的情况下取得的。这些限制使中国无法获取最强大的芯片,如英伟达H100。这表明要么深度求索找到了绕过相关规则的方法,要么美国的出口管制并未达到预期效果。
标杆资本普通合伙人切坦·普塔贡塔认为,深度求索采用预训练大型模型,并利用蒸馏技术提升小型模型的能力,这是一种非常具有成本效益的方法。
近期,中国在一个月内进行了四次军事力量的展示,这些举动不仅体现了远程军事投射和远洋作战的实力,也对美国的挑衅行为作出了回应
2024-08-12 09:23:25美媒紧盯中国与美国不相上下关于美国对于奥运金牌的态度,从美国主流媒体的报道中可窥见一二。《洛杉矶时报》在一篇奥运专题文章中指出,随着巴黎奥运会接近尾声,一个未曾预料的局面出现了:中国与美国的金牌数持平,均为33枚
2024-08-11 17:56:46美媒紧张:与中国的金牌之战进入最后关头