在今年的I/O开发者大会上,谷歌发布了新一代视频生成模型Veo3,这是其首个可以生成视频背景音效的模型。该模型不仅能合成画面,还能为鸟鸣或街头交通等场景配上相应的音效,甚至能够生成人物对话。据称,Veo 3在物理模拟与口型同步方面表现出色。
目前,这一新模型仅面向美国地区的Gemini Ultra用户以及Vertex AI的企业用户开放,并已被集成到谷歌的AI影视制作工具Flow中。通过Flow,用户依然可以上传人物、风格、场景或物体的图像作为参考,并利用镜头控制功能进行旋转、缩放,甚至调整画面从竖屏到横屏,或者在视频中添加、删除元素。
面对越来越难以辨别的人工智能生成内容,谷歌推出了SynthID Detector工具。用户可以通过上传媒体文件来检测其中是否包含由谷歌用于标记AI作品的SynthID水印。不过,值得注意的是,目前并非所有的图像生成模型都支持这种水印技术。
美国搜索引擎和AI巨头谷歌公司周三宣布产品线全面上新,所有用户正式迈入“Gemini 2.0”时代。其中,Gemini 2.0 Flash模型上线,这款模型适用于大规模、高容量、高频率任务
2025-02-07 07:51:07谷歌更新多款Gemini2AI技术正在重塑科技巨头之间的竞争格局。谷歌近期频繁动作,试图重新确立其在行业中的领导地位
2025-05-30 22:24:56谷歌大变天谷歌DeepMind团队于5月27日宣布推出SignGemma,这是其迄今为止最强大的手语翻译模型,能够将手语转化为口语文本。该开源模型计划在今年晚些时候加入Gemma模型家族
2025-05-31 23:30:49谷歌DeepMind最强手语翻译模型登场中国人工智能企业DeepSeek近日发布最新开源模型,引发广泛关注。谷歌首席执行官孙达尔·皮柴在迪拜举行的世界政府峰会上表示,DeepSeek在展示AI的全球化程度方面表现出色
2025-02-15 00:11:56谷歌CEO太平洋时间周一晚上8点(北京时间周二中午12点),马斯克旗下的人工智能初创公司xAI将发布其聊天机器人Grok 3,马斯克会进行现场演示。此前,马斯克曾称Grok 3为“地球上最聪明的人工智能”
2025-02-18 12:41:37马斯克正式发布AI模型Grok3谷歌本周从其网站上删除了不开发用于武器或监控的人工智能的承诺。这一变化最初由彭博社发现。该公司似乎更新了其公开的人工智能原则页面,删除了名为“我们不会追求的应用”的部分
2025-02-06 08:02:20谷歌修改AI道德准则