农历除夕夜,在全球华人喜迎新春之时,纽约证券交易所的电子屏上,阿里巴巴股价在收盘前从涨幅1%快速拉升至6.7%。这一行情异动背后是一场技术奇袭。
1月29日凌晨,阿里通义千问团队悄然上线的大模型Qwen2.5-Max在多个权威基准测试中展现出与全球顶级模型比肩的性能。这是继DeepSeek之后,中国AI阵营在高性能、低成本技术路线上的又一重要突破。市场人士分析称,此前过度聚焦DeepSeek,忽视了包括阿里通义在内的中国AI整体性追赶。行业媒体认为,若阿里Qwen-2.5-max的确性能超过V3,可以对其RL推理模型给予更大期待。
当阿里云展现出“强大模型+充足算力+完整云平台”的组合优势时,这是否印证了类似去年北美云计算服务商的投资逻辑?如果美股因AI整体增值10万亿美元,中国AI资产的重估时机是否已至?
Qwen2.5-Max采用超大规模MoE架构,基于超过20万亿token的预训练数据。在MMLU-Pro、LiveCodeBench、LiveBench和Arena-Hard等多个权威评测中,该模型均展现出与DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩甚至领先的性能。阿里团队表示,随着后训练技术的不断进步,下一个版本将有望达到更高水平。
Qwen2.5团队同步发布了两个创新型号:Qwen2.5-7b-instruct-1m和Qwen2.5-14b-instruct-1m。这些开源模型支持高达100万token的上下文窗口,成为业内首个达到此规模的公开可用模型。这些模型使用稀疏注意力,处理百万token输入的速度比传统方法快3到7倍,输出长度可达8000个token。在测试中,14B型号和Qwen2.5-Turbo在查找非常长的文档中的隐藏数字时都达到了完美的准确性,较小的7B型号也表现良好,只有轻微的错误。在RULER、LV-Eval和LongbenchChat等要求更高的复杂的上下文测试中,百万token模型的表现优于128K token模型,尤其是在超过64K token的序列中,14B型号在RULER中得分超过90分,持续击败gpt-4o mini。
DeepSeek的崛起在全球资本市场引发了一波科技浪潮。高盛、德意志银行、美国银行和贝莱德等外资机构纷纷表达了对中国资产和A股市场的乐观态度,中国资产的价值重估成为不可忽视的趋势
2025-02-11 12:08:49DeepSeek引发外资重估中国资产近段时间,DeepSeek热潮席卷全球,在美股科技龙头出现剧烈调整的同时,以美股中概股和港股为代表的中国资产却逆势上扬。金山云、腾讯、阿里巴巴等个股股价显著攀升
2025-02-12 08:59:26DeepSeek或重塑AI产业格局DeepSeek开年爆火,不仅相关概念股股价上涨,中概股、港股新兴产业板块等中国资产也在持续走强。多家外资机构发表最新中国股市策略报告称,DeepSeek的推出将改变中国股票估值折价的现状
2025-02-16 10:26:26DeepSeek引发基础大模型价值重估广发证券发展研究中心的首席资产研究官戴康指出,当前港股正处在牛市的发展中期,这是一个价值重估的关键阶段。至于能否顺利过渡到以基本面持续改善为特征的第三阶段,还有待盈利增长的实际情况来确认
2024-10-05 17:30:08券商:港股价值重估