4月27日,中关村论坛未来人工智能先锋论坛举行期间,生数科技携手清华大学宣布了一个重要成果:中国首个长时长、高一致性、高动态性视频大模型Vidu正式面世。该模型依托团队独创的U-ViT架构,结合Diffusion与Transformer技术,能够轻松生成16秒长度、1080P高清的视频内容,操作简便。
Vidu模型不仅在模拟现实世界的精准度上有所建树,还展现了强大的创意生成能力,比如创造虚拟场景和处理多镜头切换,同时确保视频的时空连贯性,达到国际先进水平,并持续优化升级。它与国际知名的Sora模型相比,在视频生成时长及质量上均有显著提升,特别是在细节还原、虚构场景构造、动态镜头运用及对中国文化元素的融入上,表现出色。Vidu通过“一镜到底”的技术手段,实现视频内容的无缝生成,凸显了其算法的高效与连贯性。
技术背后,是团队在贝叶斯机器学习和多模态大模型领域的深厚积累。他们提出的U-ViT架构,作为全球首个将Diffusion与Transformer融合的创新设计,早于同类技术,展示了团队的前瞻性和自主研发实力。今年3月,团队进一步开源了基于U-ViT的多模态扩散大模型UniDiffuser,完成了融合架构大规模应用的可行性验证,模型参数接近10亿,实现了图文模态间的自由转换。
基于U-ViT的深入探索和实践,生数科技仅用两个月便在长视频处理技术上取得突破,推出了Vidu。这一模型不仅提升了视频生成的连贯性和动态范围,还预示着向更广泛模态应用的迈进,展现出通用视觉模型的潜力。
2月16日凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。
2024-02-16 10:58:51OpenAI发布首个文生视频模型Sora原标题:生数科技发布视频大模型「Vidu」引关注清华团队国产Sora火了【环球网科技综合报道】近日,生数科技联合清华大学发布了视频大模型「Vidu」,引发了广泛关注。
2024-04-28 08:53:33清华团队国产“Sora”火了原标题:AI生成的《西游记》短片震惊网友Sora到底懂不懂物理世界?一年前,AI模型ChatGPT的问世引发了社会各界广泛讨论,如今AI技术已经带来翻天覆地的变化。
2024-02-20 09:48:16Sora到底懂不懂物理世界?10月23日,第四届“长沙·中国1024程序员节”在长沙盛大开幕。作为全国首条程序员街的“1024街区”,以崭新的项目建设成绩迎接全球技术大咖齐聚。
2023-10-24 14:11:40今天程序员节金十数据所提供的数据解读,由计算机系统自动抓取并经算法计算得出,属于理论层面的分析,不代表实际市场或事件的影响效果。我们深知数据时效与精确性对于用户的重要性,故始终致力于提升数据发布的速度与准确性
2024-04-12 20:20:32首饰金价直逼740元每克深圳市柔宇科技股份有限公司,一家曾被誉为国内领先的全柔性屏幕技术创新企业,最近再次陷入了欠薪的困境。
2023-12-26 10:39:41柔宇科技数十名员工现场罢工讨薪