DeepSeek团队主要由北大、清华等顶级高校的博士生组成,许多人曾在顶级学术期刊发表论文并获奖。这种招聘策略有助于营造自由协作的文化,研究人员可以利用充足的计算资源进行创新研究。
面对DeepSeek的崛起,一些硅谷巨头表达了不同的看法。OpenAI创始人奥特曼认为复制已知有效的方案相对容易,探索未知领域则充满挑战。Perplexity AI的CEO斯林尼瓦斯表示,DeepSeek在很大程度上复制了OpenAI的技术并开源了它,但他也赞叹了DeepSeek的快速步伐。Stability AI的创始人Mostaque暗示DeepSeek给资金更充裕的竞争对手带来了压力。Meta AI首席科学家杨立昆强调,DeepSeek的成功证明了开源模型正在超越闭源系统。
DeepSeek通过一系列工程技术优化了模型架构,包括定制化芯片间通信方案、减少字段大小以节省内存,以及创新性地使用专家混合模型方法。这些技术使DeepSeek的模型更具成本效益,训练所需的计算资源远少于竞争对手。DeepSeek R1是一个转折点,因为它主要通过机械强化学习进行学习,而不是依赖大量监督数据。
DeepSeek愿意将其创新成果开源,得到了全球AI研究社区的高度赞赏。英伟达资深研究员樊锦赞扬了DeepSeek的透明度,并指出其强化学习方法的重要性。科技企业家Arnaud Bertrand认为,竞争性开源模型的出现可能对OpenAI的商业模式造成冲击。
DeepSeek的崛起对英伟达来说是一个利空因素。由于美国政府的AI芯片禁运,中国无法采购英伟达最高性能的AI芯片,而H800则是高算力A100芯片的阉割版。尽管如此,DeepSeek依然成功地训练出了强劲的大模型。未来,中国AI行业可能会面临更多挑战,尤其是在芯片和出口管制方面。
过去一周,中国的人工智能大模型成为硅谷乃至全球科技界的热议话题。引发这场讨论的是中国人工智能初创公司深度求索(DeepSeek)
2025-01-27 10:02:46幻方DeepSeek如何震惊硅谷短短一个月内,中国AI初创公司深度求索(DeepSeek)发布了两款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:21:32DeepSeek大模型强在哪白头鹰再次针对一家小公司采取行动,使用的依旧是那些熟悉的手段。近期,一家初创公司推出的DeepSeek软件在全球范围内引起轰动,在160多个国家的AI软件下载排行榜上位居榜首
2025-02-04 19:33:47DeepSeek美股泡沫得以延续中国国产大模型Deepseek在硅谷引起了轰动。从斯坦福到麻省理工,Deepseek R1几乎一夜之间成为美国顶尖大学研究人员的首选模型
2025-01-27 15:33:19媒体揭秘国产大模型DeepSeek短短一个月内,中国AI初创公司深度求索(DeepSeek)发布了两款大模型——DeepSeek-V3和DeepSeek-R1
2025-01-26 10:34:01DeepSeek让Meta深陷恐慌