阿里通义千问开源负责人林俊旸在X上发文暗示,Qwen3模型有望于4月28日发布。此前,Qwen3系列模型合集曾在阿里巴巴旗下AI模型开源社区ModelScope短暂亮相后下线,包括Qwen3-4B-Base、Qwen3-1.7B、Qwen3-0.6B及Qwen3-30B-A3B-Base四款模型,均采用Apache License 2.0开源协议。尽管官方尚未正式公告,但从命名规则与前代技术逻辑来看,可以推测其技术路径和定位方向。
此次发布的模型中,Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B分别对应40亿、17亿和6亿参数,这类无后缀的命名方式可能表明它们为单架构稠密模型,未采用混合专家(MoE)设计,适合轻量化应用场景。而Qwen3-30B-A3B-Base则是MoE架构的基础模型,总参数300亿(30B),动态调用30亿(3B)参数处理任务。此外,Qwen3支持高达256K的上下文长度,涵盖推理与非推理任务。
自2023年8月以来,阿里云已相继开源了Qwen、Qwen1.5、Qwen2、Qwen2.5等四代模型,涵盖了从0.5B到110B的不同参数规模,涉及大语言、多模态、数学和代码等多种模态。
3月6日凌晨,阿里云通义千问官微宣布发布并开源了最新的推理模型QwQ-32B。这款模型拥有320亿参数,性能可以与具备6710亿参数的DeepSeek-R1相媲美
2025-03-06 09:53:18阿里推最新通义千问QwQ-32B推理模型3月17日,桑尼·迪克森曝光了一组iPhone 17系列手机的模型机照片,其中包含中文标注的尺寸信息。这些模型机展示了苹果新款手机的设计亮点,如Air和Pro机型的新相机Deco设计、不同机身厚度等
2025-03-17 15:02:12iPhone17系列模型机曝光农历除夕夜,全球华人喜迎新春之时,纽约证券交易所的电子屏上,阿里巴巴美股股价在收盘前从涨幅1%快速拉升至6.7%。这一行情异动背后,是一场技术上的奇袭
2025-01-29 23:11:26阿里除夕夜抛出重磅新模型