注册登录

中华网 china.com

新闻

国内国际社会体育专题军事财经滚动政务冬奥

阿里除夕夜抛出重磅新模型 Qwen2.5-Max性能惊艳

小大

用微信扫描二维码
分享至好友和朋友圈

关键词：

2025-01-29 23:11:26 华尔街见闻

农历除夕夜，全球华人喜迎新春之时，纽约证券交易所的电子屏上，阿里巴巴美股股价在收盘前从涨幅1%快速拉升至6.7%。这一行情异动背后，是一场技术上的奇袭。

1月29日凌晨，阿里通义千问团队悄然上线了大模型Qwen2.5-Max，在多个权威基准测试中展现出与全球顶级模型比肩的性能。这是继DeepSeek之后，中国AI阵营在高性能、低成本技术路线上的又一重要突破。

市场人士分析称，此前过度聚焦DeepSeek，却忽视了包括阿里通义在内的中国AI整体性追赶。行业媒体《信息平权》表示，若阿里Qwen-2.5-max的性能超过V3，可以对其RL推理模型给予更大期待。

当阿里云展现出“强大模型+充足算力+完整云平台”的组合优势时，是否印证了类似去年北美云计算服务商的投资逻辑？如果美股因AI整体增值10万亿美元，中国AI资产的重估时机是否已至？

Qwen2.5-Max采用超大规模MoE（混合专家）架构，基于超过20万亿token的预训练数据。在MMLU-Pro、LiveCodeBench、LiveBench以及Arena-Hard等多个权威评测中，该模型均展现出与DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩甚至领先的性能。阿里团队表示，随着后训练技术的进步，下一个版本将有望达到更高水平。

Qwen2.5团队同步发布了两个创新型号：Qwen2.5-7b-instruct-1m和Qwen2.5-14b-instruct-1m。这些开源模型支持高达100万token的上下文窗口，成为业内首个达到此规模的公开可用模型。这些模型使用稀疏注意力，处理百万token输入的速度比传统方法快3到7倍，输出长度可达8000个token。

在测试中，14B型号和Qwen2.5-Turbo在查找非常长的文档中的隐藏数字时都达到了完美的准确性。较小的7B型号也表现良好，只有轻微的错误。在RULER、LV-Eval和LongbenchChat等要求更高的复杂的上下文测试中，百万token模型的表现优于128K token模型，尤其是在超过64K token的序列中，14B型号甚至在RULER中得分超过90分——这是Qwen系列的第一次——在多个数据集上持续击败gpt - 4o mini。

12 全文共 2 页下一页

关闭

网曝河北邢台一局长酒后砸店伤人当地纪委介入调查

局长酒后砸店伤人纪委介入调查2025-02-18 13:40:15

安徽一车坠河4人遇难事故仍在调查处理中

安徽一车坠河4人遇难2025-02-18 13:38:27

陈晓陈妍希今后各自安好感恩遇见共伴成长

陈晓陈妍希今后各自安好2025-02-18 13:36:18

陈晓陈妍希今后各自安好感恩遇见共伴成长

陈晓陈妍希今后各自安好2025-02-18 13:36:18

拉夫罗夫抵达沙特单手揣兜下飞机谈判桌上的博弈

拉夫罗夫抵达沙特单手揣兜下飞机2025-02-18 13:13:44

泽连斯基将到访沙特不参与美俄会谈

泽连斯基将到访沙特2025-02-18 13:34:14

外媒：以色列内阁投票确认扎米尔为下任以军总参谋长即将于3月5日就职

外媒,以色列内阁投票确认扎米尔为下任以军总参谋长2025-02-18 11:44:19

陈晓陈妍希将共同抚养孩子和平分手引热议

陈晓陈妍希将共同抚养孩子2025-02-18 13:27:22

合作导演称饺子上下班照常骑自行车低调健康生活典范

合作导演称饺子上下班照常骑自行车2025-02-18 13:30:25

美国翻脸后，欧洲从“夸夸其谈的少年”走向独立成熟要做三件事应对三大危机

美国翻脸后,欧洲从夸夸其谈的少年走向独立成熟要做三件事2025-02-18 13:29:52

网曝河北邢台一局长酒后砸店伤人当地纪委介入调查

局长酒后砸店伤人纪委介入调查2025-02-18 13:40:15

中医劝你春季养好脾胃调养脾胃祛风除湿

中医劝你春季养好脾胃2025-02-18 13:23:22

马斯克坐实AI游戏工作室计划让游戏再次伟大

马斯克坐实AI游戏工作室计划2025-02-18 13:19:44

特朗普批波音总统专机还没造好项目拖延引不满

特朗普批波音总统专机还没造好2025-02-18 13:31:20

暴雪《守望先锋》国服明日回归！中国主题四大天王皮肤来了国服专属福利揭晓

暴雪守望先锋国服明日回归,中国主题四大天王皮肤来了2025-02-18 13:34:36

广西首个第四代住宅亮相南宁户户有私家园林

广西首个第四代住宅亮相南宁2025-02-18 13:25:11

媒体批特朗普又一次“抢劫”台湾美国的真实意图暴露

媒体批特朗普又一次抢劫台湾2025-02-18 13:15:58

宇树科技创始人王兴兴曾差点没考上高中从内向少年到科技领军人物

宇树科技创始人王兴兴曾差点没考上高中2025-02-18 13:07:27

美为何提议从中国向乌派遣维和人员美国的奇葩主意

美为何提议从中国向乌派遣维和人员2025-02-18 13:14:02

美方：乌克兰能“上桌”谈判欧洲被排除引发争议

美方,乌克兰能上桌谈判2025-02-18 11:43:42

沪指半日涨0.29% 四大行再创新高银行股逆势走强

沪指半日涨0.29%四大行再创新高2025-02-18 13:27:50

18岁男孩非法穿越鳌太线获救救援行动再启

18岁男孩非法穿越鳌太线获救2025-02-18 13:25:39

美俄谈判今日开始泽连斯基：不承认乌克兰缺席引发争议

美俄谈判今日开始泽连斯基,不承认2025-02-18 13:20:24

22日起哪吒2港澳地区全面上映两地首映仪式相继举行

22日起哪吒2港澳地区全面上映2025-02-18 13:31:54

卡塞米罗：必须继续欣赏C罗或者梅西和内马尔他们在另一个世界足球传奇永不落幕

卡塞米罗,必须继续欣赏C罗或者梅西和内马尔他们在另一个世界2025-02-18 13:30:07

特朗普批波音：总统专机怎么还没造好项目拖延引不满

特朗普批波音,总统专机怎么还没造好2025-02-18 13:02:01

章昊直播时模仿徐冬冬姿势

章昊模仿徐冬冬姿势2025-02-18 13:34:13

网传小学老师因末位淘汰轻生真相尚在调查中

网传小学老师因末位淘汰轻生2025-02-18 13:22:50

突然宣布：腾讯一产品即将停止运营服务迁移至腾讯元宝

突然宣布,腾讯一产品即将停止运营2025-02-18 13:32:20

伊朗：反对外国势力干涉叙利亚支持叙人民自决权

伊朗,反对外国势力干涉叙利亚2025-02-18 13:33:51

曾被雷军千万年薪挖角！亲属称罗福莉与丈夫研究领域相同

亲属称罗福莉与丈夫研究领域相同2025-02-18 13:11:57

波兰外长：在黄油和枪炮间很难选择欧洲需加强国防开支

波兰外长,在黄油和枪炮间很难选择2025-02-18 13:33:55

安徽一车坠河4人遇难事故仍在调查处理中

安徽一车坠河4人遇难2025-02-18 13:38:27

美客机翻覆现场视频曝光恶劣天气或成事故主因

美客机翻覆现场视频曝光2025-02-18 13:20:05

大V：欧洲和乌克兰遭受三次沉重打击西方暴露三大问题

大V,欧洲和乌克兰遭受三次沉重打击2025-02-18 13:13:27

相关新闻

阿里新模型声称超越DeepSeek 展现领先性能
阿里云通义千问超大规模的MoE模型Qwen2.5-Max于1月29日凌晨正式上线。该模型是阿里云通义团队对MoE模型的最新成果，预训练数据超过20万亿tokens
2025-01-30 13:16:20阿里新模型声称超越DeepSeek
光刻机巨头抛出重磅信号重大宣布！
11月14日，光刻机巨头阿斯麦股价在欧洲市场大幅上涨，涨幅超过5.3%，达到661.10欧元/股。美股盘前，阿斯麦股价也上涨超过3%
2024-11-15 17:38:01光刻机巨头抛出重磅信号
DeepSeek发布新模型 Janus-Pro超越DALL-E 3
DeepSeek发布了新款开源多模态AI模型Janus-Pro。该模型在GenEval和DPG-Bench基准测试中表现优异，超越了OpenAI的DALL-E 3和Stable Diffusion
2025-01-28 09:17:49DeepSeek发布新模型
DeepSeek新模型“火”到海外引发硅谷恐慌
短短一个月内，中国AI初创公司深度求索（DeepSeek）发布了两款大模型：DeepSeek-V3和DeepSeek-R1
2025-01-26 15:51:02DeepSeek新模型火到海外
OpenAI将发布ChatGPT新模型 GPT-4.5即将亮相
OpenAI首席执行官奥尔特曼在当地时间12日通过X平台宣布，OpenAI将在几周内发布GPT-4.5模型。尽管该模型已经开发了20多个月，但公司内部认为它不会像预期的那样带来重大突破
2025-02-14 01:44:23OpenAI将发布ChatGPT新模型
DeepSeek再发布新模型 Janus-Pro显著提升多模态能力
1月28日凌晨，人工智能社区Hugging Face上发布了开源多模态AI模型Janus-Pro。作为Janus的高级版本，Janus-Pro采用了优化的训练策略，扩展了训练数据，并且拥有更大的模型规模
2025-01-29 07:32:49DeepSeek再发布新模型

今日热点

詹姆斯23分9板9助湖人客场险胜步行者

NBA正式扩军 32队时代来了扩军计划正式启动

南方将迎今年首场大范围强对流天气雨势猛烈破纪录

20元纸币背景观景台乱收费？景区通报已清理取缔违规点位

频道热点

主编邮箱
网上不良信息举报电话：010-56177181

关于中华网 | 广告服务 | 联系我们 | 招聘信息 | 版权声明 | 豁免条款 | 友情链接 | 中华网动态
版权所有中华网