8月21日,深度求索正式发布了DeepSeek-V3.1大语言模型。这款新模型最大的技术亮点是“混合推理架构”,能够在单一架构内同时支持思考模式与非思考模式。用户可以通过“深度思考”按钮实现无缝切换,在复杂任务中启用链式推理,在简单任务中快速响应。
根据官方数据,DeepSeek-V3.1-Think在多项专业评测中表现突出,如AIME 2025、GPQA和LiveCodeBench等基准测试中与前代模型R1-0528性能持平,但输出token数减少20%~50%,显著降低了推理成本。在非思考模式下,模型也能以更短的输出长度保持同等性能。
此次升级被视为DeepSeek在AGI竞争中的关键一步,标志着国产大模型间的竞争进入“智能体驱动”阶段。DeepSeek同步开源了V3.1的Base模型和后训练模型,参数规模达840B tokens,并在Hugging Face和魔搭社区开放下载。API方面,deepseek-chat(非思考模式)和deepseek-reasoner(思考模式)的上下文统一扩展至128K。
值得注意的是,DeepSeek宣布自9月6日起调整API定价并取消夜间优惠。输入价格上,缓存命中时为0.5元/百万tokens,缓存未命中的价格则为4元/百万tokens;输出价格为12元/百万tokens。这一举措被业内解读为,深度求索将从年初的关注价格转向价值竞争的信号。此外,V3.1使用的UE8M0FP8精度是针对下一代国产芯片设计的,这可能意味着DeepSeek在硬件适配方面投入了更多资源。
DeepSeek-V3.1的发布反映了国产大模型竞争焦点正从“长上下文”转向“智能体能力”。今年7月,月之暗面发布的Kimi K2是一个拥有万亿参数规模的混合专家模型,在SWE Bench Verified、Tau2和AceBench等基准性能测试中均取得开源模型中的最高水平成绩。Kimi K2可以帮助用户直接制定旅行计划并预订机票和酒店。
智谱AI在7月28日发布的GLM-4.5系列也定位为“Agent原生基础模型”,并在8月20日发布了全球首个手机Agent AutoGLM2.0,具备推理、代码与多模态的全能能力,同样可以一键订票订咖啡。DeepSeek-V3.1也在编程智能体测评和搜索智能体测评中表现出色。
随着智能体应用场景的深化,国产大模型或将从“基础能力追赶”进入“垂直领域深耕”阶段,厂商将在推理效率、工具调用生态和成本控制之间找到平衡点。
4月7日,日本吉野家宣布,为应对原材料价格、流通成本和劳动力成本的长期上涨,决定自4月10日起对部分产品价格进行调整
2025-04-08 08:48:00日本吉野家宣布涨价7月1日,特斯拉官方微博宣布Model 3长续航全轮驱动版车型迎来升级。此次升级使得该车型的CLTC续航里程提升至753公里,百公里加速时间缩短至3.8秒
2025-07-01 20:38:44特斯拉中国宣布涨价体育用品巨头美国耐克公司宣布,从下个月开始在美国市场提高部分产品的价格。在美国关税政策的压力下,其竞争对手德国阿迪达斯和彪马公司也可能会效仿跟进。4月7日,美国纽约一家耐克用品商店的景象引起了广泛关注
2025-05-24 13:25:14顶不住了耐克宣布宝马中国宣布接入DeepSeek,这是继与阿里巴巴达成AI大语言模型战略合作后的又一举措。此举进一步深化了宝马在中国市场的AI生态布局。未来,DeepSeek功能将应用于国产宝马新世代车型
2025-04-27 15:26:01宝马中国宣布接入DeepSeek