这套模式与Agent领域近一年热炒的“Interleaved Thinking”不谋而合。对于现实世界的复杂任务而言,这种能力要比单次大爆发式推理重要得多。真实场景里,任务往往要先搜集一轮信息、再验证、再拆解子任务、再修正路径,如果每调一次工具,模型的“思路”就被截断一次,那它就只能不停重来——既浪费token,也容易在反复重启中丢失关键线索。
V3.2在底层做的改动,是把“推理轨迹”当成上下文中的固定资产,工具调用不会刷新这条轨迹,只会在其后追加新思考。工具返回新信息之后,模型继续沿着原先的思路往下推,而非重开一局。这既让同一任务中的中间状态可以反复复用,也显著减少了毫无必要的重复生成。
综合来看,这一代DeepSeek的进步,更像是一次“算力配置逻辑”的重写:在算力总盘子并不占优的情况下,通过更聪明的架构设计和推理方式,把每一点浮点数都用到刀刃上。DSA负责把“该算的算得更专注”,交错思维负责让“每一步思考带来的信息收益更大”,两者叠在一起,指向的都是同一个目标——从一个“大号补全器”,走向一个更接近“持续思考的智能体”。
从这个意义上讲,在参数规模红利逐渐见顶之后,接下来的竞争,注定会从“谁更大”转向“谁更会用算力”和“谁能组织起更长、更稳定的思维链条”。V3.2算是这个方向的一个相对成熟的样本。
如果说架构上的变化让V3.2站稳了技术底座,那么在战略路线上的明显拐弯,则体现在一个关键词上——Agent。
过去一年,业界对Agent的话题并不少,但大部分厂商仍把它当作模型能力之上的“外挂能力”:有就加一层,没有也不至于影响大盘。DeepSeek这次则把话说得很直接——在它的技术文档和对外阐释中,“Agent能力”和“推理能力”被放在了同一高度。
DeepSeek最新发布的开源数学模型DeepSeekMath-V2,在全球最难的高中数学竞赛中达到了金牌水平,成为首个实现这一成就的开源模型,标志着开源人工智能在复杂推理能力上的一次重大突破
2025-11-28 15:24:50DeepSeek新模型有多猛11月27日晚,DeepSeek在Hugging Face上开源了一个新模型:DeepSeek-Math-V2。这是一个数学模型,也是目前首个达到IMO金牌水平且开源的模型
2025-11-28 10:26:50DeepSeek推出新模型10月20日,人工智能团队DeepSeek AI发布了全新多模态模型 DeepSeek-OCR
2025-10-20 20:33:14DeepSeek开源新模型DeepSeek-OCR由于新模型R2迟迟未发布,DeepSeek近期备受关注。国际知名半导体研究机构Semianalysis的报告显示,DeepSeek的用户使用率从年初的7.5%峰值显著下降至3%,官网流量同期下滑近三成
2025-07-10 13:25:04DeepSeek使用率暴跌原因何在证券时报的文章内容仅供参考,不构成实质性投资建议,据此操作风险自担。下载“证券时报”官方APP或关注官方微信公众号,可以随时了解股市动态,洞察政策信息,把握财富机会
2025-09-20 12:51:47DeepSeek为何发表研究成果