DeepSeek宣布涨价智能体竞争加剧

小大

用微信扫描二维码
分享至好友和朋友圈

关键词：

2025-08-21 22:04:35 IT时报

8月21日，深度求索正式发布了DeepSeek-V3.1大语言模型。这款新模型最大的技术亮点是“混合推理架构”，能够在单一架构内同时支持思考模式与非思考模式。用户可以通过“深度思考”按钮实现无缝切换，在复杂任务中启用链式推理，在简单任务中快速响应。

根据官方数据，DeepSeek-V3.1-Think在多项专业评测中表现突出，如AIME 2025、GPQA和LiveCodeBench等基准测试中与前代模型R1-0528性能持平，但输出token数减少20%～50%，显著降低了推理成本。在非思考模式下，模型也能以更短的输出长度保持同等性能。

此次升级被视为DeepSeek在AGI竞争中的关键一步，标志着国产大模型间的竞争进入“智能体驱动”阶段。DeepSeek同步开源了V3.1的Base模型和后训练模型，参数规模达840B tokens，并在Hugging Face和魔搭社区开放下载。API方面，deepseek-chat（非思考模式）和deepseek-reasoner（思考模式）的上下文统一扩展至128K。

值得注意的是，DeepSeek宣布自9月6日起调整API定价并取消夜间优惠。输入价格上，缓存命中时为0.5元/百万tokens，缓存未命中的价格则为4元/百万tokens；输出价格为12元/百万tokens。这一举措被业内解读为，深度求索将从年初的关注价格转向价值竞争的信号。此外，V3.1使用的UE8M0FP8精度是针对下一代国产芯片设计的，这可能意味着DeepSeek在硬件适配方面投入了更多资源。

DeepSeek-V3.1的发布反映了国产大模型竞争焦点正从“长上下文”转向“智能体能力”。今年7月，月之暗面发布的Kimi K2是一个拥有万亿参数规模的混合专家模型，在SWE Bench Verified、Tau2和AceBench等基准性能测试中均取得开源模型中的最高水平成绩。Kimi K2可以帮助用户直接制定旅行计划并预订机票和酒店。

智谱AI在7月28日发布的GLM-4.5系列也定位为“Agent原生基础模型”，并在8月20日发布了全球首个手机Agent AutoGLM2.0，具备推理、代码与多模态的全能能力，同样可以一键订票订咖啡。DeepSeek-V3.1也在编程智能体测评和搜索智能体测评中表现出色。

随着智能体应用场景的深化，国产大模型或将从“基础能力追赶”进入“垂直领域深耕”阶段，厂商将在推理效率、工具调用生态和成本控制之间找到平衡点。

(责任编辑：0764)

关闭

DeepSeek宣布涨价 智能体竞争加剧

相关新闻

今日热点

频道热点

DeepSeek宣布涨价智能体竞争加剧