DeepSeek的压力最终传递到了黄仁勋身上。英伟达美股股价盘前暴跌近11%,市值缩水超过3500亿美元。资本市场开始怀疑,当相对较少的算力也能实现与OpenAI相媲美的模型性能时,高端算力芯片是否正面临新的泡沫。
这种担忧情绪进一步推高了DeepSeek的热度。短短一周内,DeepSeek应用在美区和中国区App Store免费榜上均位列第一,这是首次有AI助手类产品超越ChatGPT登顶美区App Store。由于用户激增,DeepSeek在两天内接连出现服务宕机现象,官方解释称这可能与服务维护和请求限制有关。
新模型DeepSeek R1是引发这场全球用户大讨论的直接原因。R1不仅开源,还免费供全球用户无限调用,打破了大厂间的资本比拼游戏。相比OpenAI在模型上的闭源及付费使用限制,DeepSeek用不到OpenAI十分之一的资源就做出了性能堪比o1的R1。
Meta担心即将发布的Llama 4在性能上可能无法赶上DeepSeek R1。OpenAI CEO奥特曼也感受到了压力,通过发布首个智能体Operator抢热度,并透露即将上线的o3-mini新消息。
DeepSeek R1在数学、代码、自然语言推理等任务上的性能可与OpenAI o1模型正式版媲美。其创新训练方法如R1-Zero路线,直接将强化学习应用于基础模型,无需依赖监督微调和已标注数据。这种方法提高了训练效率,减少了对人工干预的依赖。
DeepSeek R1的成本远低于同类模型。去年12月发布的DeepSeek-V3开源基础模型,性能对标GPT-4o,但训练成本仅为约557.6万美元。相比之下,GPT-4o模型的训练成本约为1亿美元。DeepSeek R1每百万输入tokens的价格为1~4元人民币,每百万输出tokens为16元人民币,而OpenAI o1的运行成本约为其30倍。
DeepSeek R1的成功引发了广泛关注,包括斯坦福大学计算机科学系客座教授吴恩达和微软董事长兼CEO萨提亚·纳德拉在内的多位大佬都对其表示关注。DeepSeek团队主要由年轻人才组成,专注于模型研究而不考虑商业变现。公司选择了一条理想主义路径,只做基础模型研究,不急于商业化。
DeepSeek R1已成为开源社区Hugging Face上下载量最高的大模型之一,下载量超过10万次。Meta AI首席科学家杨立昆认为,这证明开源模型正在超越专有模型。DeepSeek未来计划继续开源旗舰模型,推动开源生态发展。
DeepSeek的成功让一些初创公司转向其API,因为其价格更具吸引力。字节跳动、阿里通义以及智谱、Kimi等团队也在积极研究DeepSeek。雷军甚至挖来了DeepSeek的关键开发者罗福莉,以增强小米的大模型团队。国内大模型公司面临压力,如果不能快速跟进R1级别的模型效果,客户可能会流失。
黄金面临来自美元和美国国债收益率的压力,两者近期均表现强劲。过去一周内,黄金现货价格下降约0.1%至2621.4美元,期货价格下跌0.5%至2631.9美元
2024-12-30 21:41:02黄金头顶的两座大山看到谷雨成功考上大学后和那个疯女孩擦肩而过的对视时,瞬间被这组镜头的寓意击中了!
2024-09-27 13:40:29大山女孩的两种结局10月10日,香港特区政府宣布,将位于坚尼地城的鲁班先师庙和元朗锦田的邓伯裘故居列为法定古迹
2024-10-10 14:43:53香港将两座历史建筑列为法定古迹