DeepSeek撼动AI生态游戏规则!今年春节,一款名为DeepSeek R1的中国大模型在全球AI圈引起了广泛关注。这款模型直接对标了OpenAI去年9月发布的OpenAI o1系列模型。1月27日,DeepSeek在中国区和美国区苹果App Store免费榜上同时冲到了下载量第一,单周下载量高达约240万次。
在DeepSeek R1发布之前,OpenAI o1一直是中国大模型厂商难以企及的目标。然而,DeepSeek R1的出现改变了这一局面。OpenAI CEO奥特曼表示,这是一个令人印象深刻的模型,英伟达也称赞其为最先进的大语言模型。与OpenAI的闭源策略不同,DeepSeek R1不仅开源,还免费供全球用户无限调用。
这场由DeepSeek引发的AI风暴,也引起了一些恐慌和攻击。Meta内部员工透露,生成式人工智能部门陷入恐慌;OpenAI则在两周内接连发布了三个大模型:两个AI智能体Operator、Deep Research以及推理模型o3-mini。此外,1月28日凌晨,DeepSeek官网连续发布公告称,线上服务受到大规模恶意攻击。
值得注意的是,DeepSeek打破了大模型行业拼算力的共识,仅用了不到OpenAI十分之一的资源就做出了性能对标OpenAI o1的DeepSeek R1。这引发了人们对AI上下游产业的重新思考。截至1月27日美股收盘,美股科技股大跌,费城半导体指数下跌9.2%,英伟达股价下跌近17%。
2023年春节,ChatGPT的出现点燃了AI行业的火种。自那之后,每年春节都有爆火的大模型出现。2024年是Sora,2025年则是DeepSeek。今年,站在C位的是中国的深度求索。DeepSeek上线20天,日活突破2000万,彻底冲击了AI行业。
实际上,相比OpenAI和其他公司动辄数亿美元的训练成本,DeepSeek始终走的是“花小钱,办大事”的路线。早在去年12月底,DeepSeek发布的V3模型仅使用2048块英伟达H800芯片,耗费约560万美元。相比之下,GPT-4o使用上万块英伟达H100芯片,训练成本约1亿美元。
近日,在瑞典斯德哥尔摩举行的GoWest风险投资人会议上,DeepSeek引起了广泛关注。许多欧洲初创公司表示已经从OpenAI的ChatGPT迁移到了这个中国的AI应用程序
2025-02-04 18:13:37DeepSeek繁荣了欧洲AI生态2月26日,在开源周第三天,DeepSeek宣布开放高效的FP8 GEMM库DeepGEMM。这三天的发布内容都与算法相关,偏向技术层面
2025-02-26 21:35:35DeepSeek开源第三日行业影响几何在DeepSeek极低成本的推动下,开源模型和闭源模型之间的差距显著缩小,掀起了一轮国产AI芯片厂商竞相适配的风潮
2025-02-15 18:37:10DeepSeek训练仍基于英伟达CUDA生态