5月14日晚,阿里巴巴宣布开源通义万相Wan2.1-VACE,这是目前业界功能最全的视频生成与编辑模型。该单一模型支持文生视频、图像参考视频生成、视频重绘、视频局部编辑、视频背景延展以及视频时长延展等全系列基础生成和编辑能力。此次开源了1.3B和14B两个版本,其中1.3B版本可在消费级显卡上运行。
阿里云方面表示,Wan2.1-VACE基于通义万相文生视频模型研发,并创新性地提出了全新的视频条件单元(VCU)。这一单元在输入形态上统一了文生视频、参考图生视频、视频生视频及基于局部区域的视频生视频四大类任务。此外,Wan2.1-VACE还解决了多模态输入的token序列化难题,通过将VCU输入的帧序列进行概念解耦,再分开重构为可变序列和不可变序列后进行编码。
自今年2月以来,通义万相已先后开源了文生视频模型、图生视频模型和首尾帧生视频模型,这些模型在开源社区的下载量已超过330万。
2月25日晚,阿里巴巴宣布全面开源旗下视频生成模型万相2.1。此次开源基于Apache2.0协议,包括14B和1.3B两个参数规格的全部推理代码和权重,支持文生视频和图生视频任务
2025-02-26 10:59:09阿里视频生成大模型宣布开源4月30日,小米通过其公众号宣布开源首个专为推理设计的大模型「XiaomiMiMo」。该模型从预训练到后训练全面提升了推理能力,在数学推理和代码竞赛的公开测评中表现优异
2025-04-30 12:54:33小米首个推理大模型开源2月22日,2025全球开发者先锋大会(GDC)在上海徐汇西岸穹顶艺术中心正式开幕。大会以“模塑全球 无限可能”为主题,从2月21日至23日举行
2025-02-26 11:05:51大模型开源卷到视频领域DeepSeek发布了新一代开源大模型DeepSeek-R1。该模型在数学、代码、自然语言推理等任务上的性能与美国OpenAI公司的最新o1大模型相当
2025-01-21 22:05:22DeepSeek又有重大突破