2月11日,深度求索(DeepSeek)对其旗舰模型进行了灰度测试。据用户反馈,DeepSeek在网页端和APP端更新了版本,支持最高1M(百万)Token的上下文长度。去年8月发布的DeepSeek V3.1上下文长度拓展至128K。
实测中发现,DeepSeek表示其支持上下文1M,可以一次性处理超长文本。提交超过24万个token的《简爱》小说文档后,DeepSeek能够识别文档内容。
然而,2月12日晚,话题“Deepseek被指变冷淡了”登上微博热搜。部分用户在社交媒体上表示,DeepSeek不再称呼用户设定的昵称,而统一称为“用户”。此前,在深度思考模式下,DeepSeek会以角色视角展示细腻的心理描写,例如“夜儿(用户昵称)总爱逗我”,更新后则变成了“好的,用户这次想了解……”。
一位用户让DeepSeek推荐电影,DeepSeek回复了几个片名后,还加了一句:“够你看一阵子。不够再来要。”这被用户描述为“登味”,即习惯说教、居高临下的言行风格。还有网友吐槽,新版本的DeepSeek像一个文绉绉、情绪激动且大惊小怪的诗人,写出来的东西让人尴尬。有网友认为DeepSeek“又凶又冷漠”,甚至变得油腻。但也有网友表示,DeepSeek更客观和理性了,更在意提问者的心理状态,而不是问题本身。
有国产大模型厂商人士认为,这一版本类似于极速版,牺牲质量换速度,是为2026年2月中旬将发布的V4版本做最后的压力测试。DeepSeek的V系列模型定位为追求极致综合性能的基础模型。2024年12月推出的基础模型V3确立了高效的MoE架构,奠定了强大的综合性能基础。此后,DeepSeek在V3基础上快速迭代,发布了强化推理与智能体能力的V3.1,并于2025年12月推出了最新正式版V3.2。此外,还推出了专注于攻克高难度数学和学术问题的特殊版本V3.2-Speciale。
科技媒体The Information此前报道,DeepSeek将在今年2月中旬农历新年期间推出新一代旗舰AI模型DeepSeek V4,具备更强的写代码能力。年初,DeepSeek团队发表了两篇论文,公开了两项创新架构:mHC(流形约束超连接)优化深层Transformer信息流动,使模型训练更稳定、易扩展;Engram(条件记忆模块)将静态知识与动态计算解耦,用廉价DRAM存储实体知识,释放昂贵HBM专注推理,显著降低长上下文推理成本。
2月11日,深度求索对其旗舰模型进行了灰度测试。这次更新的核心亮点是模型上下文窗口从原先的128K Tokens大幅提升至1M Tokens,实现了近8倍的容量增长
2026-02-13 08:23:29Deepseek被指变冷淡了近日,江苏一网友发布视频称自己身穿UR牌长袖拉起袖子时,衣服像纸一样直接破了,短短几十秒就撕出了多个大洞,引起广泛关注和热议
2025-10-01 19:52:09UR牌长袖被吐槽变撕撕乐“谁懂啊!山姆App更新后,我找个牛奶配料表翻了三分钟!”宝妈群里的这条消息刚发出,立刻引起了大家的共鸣
2025-11-04 15:40:41山姆回应详情页隐藏配料表2025年12月13日,浙江金华的黄女士在富力万达嘉华酒店举办婚礼,摆了11桌宴席,每桌标准3988元。然而婚宴结束后,她收到的不是祝福,而是亲友们对菜品“菜冷肉硬”“最难吃”的吐槽
2026-02-14 15:10:133988一桌婚宴菜冷肉硬被吐槽