农历除夕夜,全球华人喜迎新春之时,纽约证券交易所的电子屏上,阿里巴巴美股股价在收盘前从涨幅1%快速拉升至6.7%。这一行情异动背后,是一场技术上的奇袭。
1月29日凌晨,阿里通义千问团队悄然上线了大模型Qwen2.5-Max,在多个权威基准测试中展现出与全球顶级模型比肩的性能。这是继DeepSeek之后,中国AI阵营在高性能、低成本技术路线上的又一重要突破。
市场人士分析称,此前过度聚焦DeepSeek,却忽视了包括阿里通义在内的中国AI整体性追赶。行业媒体《信息平权》表示,若阿里Qwen-2.5-max的性能超过V3,可以对其RL推理模型给予更大期待。
当阿里云展现出“强大模型+充足算力+完整云平台”的组合优势时,是否印证了类似去年北美云计算服务商的投资逻辑?如果美股因AI整体增值10万亿美元,中国AI资产的重估时机是否已至?
Qwen2.5-Max采用超大规模MoE(混合专家)架构,基于超过20万亿token的预训练数据。在MMLU-Pro、LiveCodeBench、LiveBench以及Arena-Hard等多个权威评测中,该模型均展现出与DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩甚至领先的性能。阿里团队表示,随着后训练技术的进步,下一个版本将有望达到更高水平。
Qwen2.5团队同步发布了两个创新型号:Qwen2.5-7b-instruct-1m和Qwen2.5-14b-instruct-1m。这些开源模型支持高达100万token的上下文窗口,成为业内首个达到此规模的公开可用模型。这些模型使用稀疏注意力,处理百万token输入的速度比传统方法快3到7倍,输出长度可达8000个token。
11月14日,光刻机巨头阿斯麦股价在欧洲市场大幅上涨,涨幅超过5.3%,达到661.10欧元/股。美股盘前,阿斯麦股价也上涨超过3%
2024-11-15 17:38:01光刻机巨头抛出重磅信号DeepSeek发布了新款开源多模态AI模型Janus-Pro。该模型在GenEval和DPG-Bench基准测试中表现优异,超越了OpenAI的DALL-E 3和Stable Diffusion
2025-01-28 09:17:49DeepSeek发布新模型短短一个月内,中国AI初创公司深度求索(DeepSeek)发布了两款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-26 15:51:02DeepSeek新模型火到海外ChatGPT面市两周年前夕,有消息称OpenAI计划推出下一代前沿旗舰模型Orion
2024-10-26 00:11:04奥尔特曼辟谣OpenAI新模型消息根据中国结算的安排,对于10月1日(周二)至10月8日(周二)提交申请的新开证券账户,于10月9日(周三)起可用于交易。
2024-10-09 10:15:05今天