1月27日,中国深度求索公司开发的DeepSeek在苹果美国地区应用商店免费APP下载排行榜上超越了ChatGPT。最近发布的开源模型DeepSeek-R1引起了全球范围内的广泛关注。
舆论认为,这一低成本、开源的人工智能模型震动了硅谷,让竞争对手感到担忧,也让科学家们兴奋不已。多方评论指出,中国AI技术的快速发展,让美国的打压政策显得尴尬。1月20日,深度求索发布了最新开源模型DeepSeek-R1,此后热度不断上升,在国内外引发了广泛讨论。顶级风投A16Z创始人马克·安德森评价称,DeepSeek-R1是他见过的最惊人、最令人印象深刻的突破之一,并称赞其为给世界的一份意义深远的礼物。
在硅谷,几乎每个人都在谈论DeepSeek。有报道称,硅谷工程师正在疯狂地分析DeepSeek,甚至有人将其称为中国的“ChatGPT时刻”。DeepSeek的特点是低成本、高性能和开源。该模型的推理计算效率极高,可以与一些顶尖的AI模型相媲美,与硅谷前沿发展保持同步。
DeepSeek-R1在技术上实现了重要突破,用纯深度学习的方法让AI自发涌现出推理能力,在数学、代码、自然语言推理等任务上的性能比肩OpenAI的o1模型正式版。据DeepSeek介绍,R1的预训练费用只有557.6万美元,远低于OpenAI GPT-4o模型的训练成本。
加利福尼亚大学伯克利分校教授亚历克斯·迪马基表示,DeepSeek的技术路线揭示了一个事实:达到顶尖性能未必需要巨额投入,这对硅谷的烧钱竞赛无异于釜底抽薪。开源也是DeepSeek备受关注的原因之一,这意味着其他企业和研究人员可以共享基础代码,构建和发布自己的产品。
英伟达资深科学家吉姆·范称赞DeepSeek是“非美国公司践行OpenAI初心”的典范,通过开放技术细节和训练方法,为全球研究者赋能。德国马克斯·普朗克光科学研究所的马里奥·克伦也认为,DeepSeek-R1的开源性非常出色,相比之下,o1和其他模型都是闭源模型“黑匣子”。
短短一个月内,中国AI初创公司深度求索(DeepSeek)发布了两款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-26 15:51:02DeepSeek新模型火到海外短短一个月内,中国AI初创公司深度求索(DeepSeek)发布了两款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:21:32DeepSeek大模型强在哪