DeepSeek又更新了,期待梁文锋“炸场” V3.1带来新惊喜。DeepSeek最近更新了线上模型版本至V3.1,但并不是大家期待的R2模型。此次升级在上下文长度和交互友好度上有显著改进,编程能力也受到推崇。有开发人员指出,DeepSeek可能将V3与R1模型进行了合并,这有助于降低模型部署成本。
DeepSeek方面回应称,一切以官方公布为准。值得注意的是,这次更新恰逢R1发布后的第七个月。在这段时间里,OpenAI、Google、阿里巴巴、月之暗面、智谱等公司纷纷发布了新模型,都将R1作为参照物。而R2作为R1的后续产品,一直是行业关注的焦点,大厂需要新的参照物,公众也在期待梁文锋的新作。
实测显示,DeepSeek网页端及最新版本App支持的上下文长度已扩展至128K。开发者体验后发现,稳定性更强,推理能力有所进步。相较于之前的V3(参数量671B),V3.1(参数量685B)在模型尺寸上变化不大,但在交互体验上有了明显提升。此外,DeepSeek在Aider Polyglot多语言编程测试中表现出色,击败了Claude 4 Opus,并且在设计宫崎骏风格的五子棋游戏界面上展示了强大的编程能力。
在最新的DeepSeek App和官网上,输入框中的“深度思考(R1)”按钮直接变成了“深度思考”。这意味着开启深度思考模式后,DeepSeek调用的推理模型可能不再局限于R1,可能是其他新模型或V3/R1合并后的新模型。有开发者指出,此次更新将V3和R1进行了合并部署,使得部署成本大幅下降。
目前,在Huggingface上,最新更新的DeepSeek-V3.1-Base版本已经开放源代码,但官方并未给出具体信息,只简单提及该模型尺寸为685B,支持BF16、F8_E4M3、F32数据类型。
3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。这次更新是DeepSeek V3模型的小版本升级,并非市场期待的DeepSeek-V4或R2
2025-03-25 09:04:50DeepSeek发布V3模型更新中国人工智能初创公司深度求索(DeepSeek)于3月24日深夜低调上线了新版本DeepSeek-V3-0324,参数量达到6850亿
2025-03-26 19:28:23DeepSeek低调扔了版更新昨晚,DeepSeek 无预警发布了 DeepSeek-V3-0324 模型。虽然官方低调地称其为“小版本迭代”,但实测表现远超预期
2025-03-25 23:00:02DeepSeek小更新表现远超预期人到中年,是人生承上启下的关键阶段,也是压力与挑战并存的时期。根据普遍的社会观察和心理研究,以下是这个阶段较为深切的“痛点”:身体机能明显下降,慢性病初现(如三高、关节问题等),恢复能力变差
2025-08-18 15:38:28DeepSeek正在遭遇中年危机DeepSeek服务突然全面宕机,API接口、网页平台及移动App均无法访问或响应。这种情况通常发生在高峰访问期间或遭遇安全攻击时
2025-08-12 07:26:40DeepSeek崩了