中华网 china.com

新闻

DeepSeek为何坚持中文思考 汉字信息密度更高(2)

关键词:
2025-12-04 14:32:17  机器之心Pro

DeepSeek为何坚持中文思考 汉字信息密度更高

该论文评估了三个最先进的开源推理模型:DeepSeek R1、Qwen 2.5 (32B) 和 Qwen 3 (235B-A22B),问题以英语呈现,但模型被明确指示以七种目标语言中的一种执行其推理步骤。最终答案必须以英语提供,以确保评估的一致性。实验结果显示,与英语相比,使用非英语语言进行推理始终能实现 20-40% 的显著令牌降低,而且通常不影响准确性。DeepSeek R1 的 token 减少量从 14.1%(俄语)到 29.9%(西班牙语)不等,而 Qwen 3 则表现出更显著的节省,韩语的减少量高达 73%。这些效率提升直接转化为推理成本降低、延迟更低和计算资源需求降低。

DeepSeek为何坚持中文思考 汉字信息密度更高

马里兰大学和微软的研究论文《One ruler to measure them all: Benchmarking multilingual long-context language models》提出了包含 26 种语言的多语言基准 OneRuler,用于评估大型语言模型(LLM)在长达 128K 令牌的长上下文理解能力。研究者们通过编写英语指令并将其翻译成另外 25 种语言构建了 OneRuler。实验表明,随着上下文长度从 8K 增加到 128K token,低资源语言与高资源语言之间的性能差距日益扩大。令人惊讶的是,英语并不是长上下文任务中表现最好的语言(在 26 种语言中排名第 6),而波兰语位居榜首。在指令和上下文语言不一致的跨语言场景中,根据指令语言的不同,性能波动幅度可达 20%。

DeepSeek为何坚持中文思考 汉字信息密度更高

既然中英文都不是具有最佳大模型性能的语言,那大模型选择思考语言的方式并不是完全以效率为先。评论区的第二种观点认为训练数据中包含更多中文内容更为合理。国产大模型采用更多中文训练语料,其思考过程出现中文是正常现象。类似的情况也出现在 AI 编程工具 Cursor 发布的新版本 2.0 核心模型「Composer-1」上,因为其思考过程完全由中文构成。

关闭

韩特检组寻求法院判金建希15年 涉嫌多宗罪名

韩特检组寻求法院判金建希15年2025-12-04 14:30:51

部分门店将老国标电动车转二手卖 潜藏安全与法律风险

部分门店将老国标电动车转二手卖2025-12-04 14:30:35

情侣婚前先后坠楼身亡双方家属回应 赔偿争议引发热议

情侣婚前先后坠楼身亡双方家属回应2025-12-04 14:17:56

乐视网负债238亿拟花1.8亿炒股 持续亏损下的投资尝试

乐视网负债238亿拟花1,8亿炒股2025-12-04 14:26:01

新国标“小电驴”长啥样?瘦了、贵了 新车数量少选择有限

新国标小电驴长啥样,瘦了,贵了2025-12-04 14:22:32

中方坚决反对日本挑战战后国际秩序、为军国主义招魂

是谁在为日本军国主义招魂2025-12-04 13:08:22

韩特检组寻求法院判金建希15年 涉嫌多宗罪名

韩特检组寻求法院判金建希15年2025-12-04 14:30:51

被捕涉诈中国公民被分批次遣返!

被捕涉诈中国公民被分批次遣返2025-12-04 14:18:22

钧正平:谁在为日本军国主义“招魂” 复活的幽灵再现

钧正平,谁在为日本军国主义招魂2025-12-04 13:10:19

高市早苗最新表态还想耍滑头!

高市早苗最新表态还想耍滑头2025-12-04 14:19:52

朝武装力量工程部队在俄排雷画面曝光

朝武装力量工程部队在俄排雷画面曝光2025-12-04 14:18:24

中国准航母舰队或绕澳航行 澳海军无法应对 实力悬殊引发担忧

中国准航母舰队或绕澳航行澳海军无法应对2025-12-04 13:31:09

金建希受审时双腿发软由两人搀扶 面临15年刑期及巨额罚款

金建希受审时双腿发软由两人搀扶2025-12-04 14:24:41

无歼击机护航时我方成功驱离外机

无歼击机护航时我方成功驱离外机2025-12-04 13:45:42

哈登创造生涯单场0罚球最高得分纪录 率队终结5连败

哈登创造生涯单场0罚球最高得分纪录2025-12-04 14:29:13

飒!新毕业女飞行员改装首飞 蓝天梦再进一步

飒,新毕业女飞行员改装首飞2025-12-04 14:28:30

失去亲信的泽连斯基还能坚持多久 生死抉择

失去亲信的泽连斯基还能坚持多久2025-12-04 13:05:10

日本拟打造宇宙作战集团 推进太空军事化

日本拟打造宇宙作战集团2025-12-04 13:14:34

中俄向日本右翼政治势力发出严重警告!

中俄向日本右翼政治势力发出严重警告2025-12-04 13:52:27

日本自民党,再被告发 违规捐款引争议

日本自民党,再被告发2025-12-04 14:21:46

日本宫古岛居民担心岛屿变战场 安全与生存的错位

日本宫古岛居民担心岛屿变战场2025-12-04 13:30:41

日本学者:高市错误言论破坏《中日联合声明》

高市错误言论破坏中日联合声明2025-12-04 14:23:31

爱泼斯坦私人岛屿内景首次曝光 细节令人不寒而栗

爱泼斯坦私人岛屿内景首次曝光2025-12-04 14:20:13

日本持续推进核污染水排海!

日本持续推进核污染水排海2025-12-04 13:17:22

日本着急替马克龙做决定!

日本着急替马克龙做决定2025-12-04 13:20:00

美空军一F16C战机坠毁 飞行员成功逃生

美空军一F16C战机坠毁2025-12-04 14:20:53

部分门店将老国标电动车转二手卖 潜藏安全与法律风险

部分门店将老国标电动车转二手卖2025-12-04 14:30:35

幼师“15天虐童上千次”案9日将开庭!

幼师“15天虐童上千次”案9日将开庭2025-12-04 14:16:03

中国应该向巴基斯坦出口歼35吗 引发外界广泛猜测

中国应该向巴基斯坦出口歼35吗2025-12-04 14:24:04

官方通报水渠石块被指一掰就掉 砂浆强度不足问题待整改

官方通报水渠石块被指一掰就掉2025-12-04 14:20:32

农户用粮食画《疯狂动物城》巨幅海报 创意致敬票房佳绩

农户用粮食画疯狂动物城巨幅海报2025-12-04 14:22:59

美财长拒答“是否保卫台湾” 避谈敏感问题

美财长拒答是否保卫台湾2025-12-04 14:28:50

日本别忘了战败国的义务 正视历史履行承诺

日本别忘了战败国的义务2025-12-04 14:29:20

相关新闻