DeepSeek为何坚持中文思考 汉字信息密度更高!前天,DeepSeek 发布了两个新模型,分别是 DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。这两个版本在推理能力上有了显著提升,DeepSeek-V3.2 版本能够与 GPT-5 相抗衡,而 Speciale 版本结合了长思考和定理证明能力,表现可媲美 Gemini-3.0-Pro。有读者评论说这个模型应该叫 V4 而不是 V3.2。

海外研究者也迅速使用了 DeepSeek 的新版本,他们注意到 DeepSeek 推理速度显著提升,但同时也遇到了困惑:即使用英文询问,模型在思考过程中还是会切换到中文。这让海外用户感到不解:明明没有用中文提问,为什么模型会用中文思考?难道用中文推理更好更快?

评论区有两种不同的观点,大部分评论认为汉字的信息密度更高。亚马逊的研究者也认同这一观点,表示表达相同的文本含义时,中文所需的字符量明显更少。如果大模型的理解与语义压缩相关,那么中文在压缩方面比英文更有效率,这可能是“中文更省 token”的原因。

具有多语言能力的大模型如果只采用英语思考的模式往往会导致一些效率问题。不光是中文,采用其他非英语的语言进行推理确实能够有更好的表现。微软的一篇论文《EfficientXLang: Towards Improving Token Efficiency Through Cross-Lingual Reasoning》发现,使用非英语语言进行推理不仅减少了 Token 消耗,还能保持准确性。即使将推理轨迹翻译回英语,这种优势依然存在,表明这种变化源于推理行为的实质性转变,而非仅仅是表层的语言效应。

该论文评估了三个最先进的开源推理模型:DeepSeek R1、Qwen 2.5 (32B) 和 Qwen 3 (235B-A22B),问题以英语呈现,但模型被明确指示以七种目标语言中的一种执行其推理步骤。最终答案必须以英语提供,以确保评估的一致性。实验结果显示,与英语相比,使用非英语语言进行推理始终能实现 20-40% 的显著令牌降低,而且通常不影响准确性。DeepSeek R1 的 token 减少量从 14.1%(俄语)到 29.9%(西班牙语)不等,而 Qwen 3 则表现出更显著的节省,韩语的减少量高达 73%。这些效率提升直接转化为推理成本降低、延迟更低和计算资源需求降低。

马里兰大学和微软的研究论文《One ruler to measure them all: Benchmarking multilingual long-context language models》提出了包含 26 种语言的多语言基准 OneRuler,用于评估大型语言模型(LLM)在长达 128K 令牌的长上下文理解能力。研究者们通过编写英语指令并将其翻译成另外 25 种语言构建了 OneRuler。实验表明,随着上下文长度从 8K 增加到 128K token,低资源语言与高资源语言之间的性能差距日益扩大。令人惊讶的是,英语并不是长上下文任务中表现最好的语言(在 26 种语言中排名第 6),而波兰语位居榜首。在指令和上下文语言不一致的跨语言场景中,根据指令语言的不同,性能波动幅度可达 20%。

既然中英文都不是具有最佳大模型性能的语言,那大模型选择思考语言的方式并不是完全以效率为先。评论区的第二种观点认为训练数据中包含更多中文内容更为合理。国产大模型采用更多中文训练语料,其思考过程出现中文是正常现象。类似的情况也出现在 AI 编程工具 Cursor 发布的新版本 2.0 核心模型「Composer-1」上,因为其思考过程完全由中文构成。

今年 1 月份也有类似的事情发生,网友发现来自 OpenAI 的 o1-pro 模型也会随机出现中文思考过程。或许这就是人类语言的魅力,不同的语言有不同的特性,在大模型中总会有各种奇怪的事情发生。大模型说中文的事情越来越多,中文训练语料也越来越丰富。


证券时报的文章内容仅供参考,不构成实质性投资建议,据此操作风险自担。下载“证券时报”官方APP或关注官方微信公众号,可以随时了解股市动态,洞察政策信息,把握财富机会
2025-09-20 12:51:47DeepSeek为何发表研究成果“今年是中国人民抗日战争、苏联伟大卫国战争暨世界反法西斯战争胜利80周年,也是联合国成立80周年。
2025-08-13 13:28:21习语丨习近平为何强调“坚持正确二战史观”?当地时间6月26日,西班牙首相桑切斯表示,西班牙作为一个主权国家,决定不将国防开支提升至国内生产总值的5%。他强调,西班牙会履行北约义务,但同时也保持自主权
2025-06-29 12:29:44西班牙为何拒绝北约军费摊派2025年11月16日,新东方32周年庆当天,创始人俞敏洪在南极发来一封992字的全员信,用“冰雪坚守”和“企鹅互助”大谈团队精神
2025-11-18 11:32:47俞敏洪该思考为何能到南极看企鹅