谷歌发布新一代图像生成模型!谷歌今日推出了全新图像生成与编辑模型Nano Banana Pro (Gemini 3 Pro Image)。该模型基于Gemini 3 Pro架构构建,宣称能以“前所未有的控制力、完美的文字渲染效果以及增强的世界知识储备”,将用户的构想转化为“工作室级”的设计作品。
相比今年9月发布的初代模型,此次更新代表了谷歌在图像生成领域的又一次重要进步。即日起,全球用户可免费试用Nano Banana Pro。用户只需登录Gemini应用,选择“生成图像”功能,并切换至“Thinking”模式即可体验这一最新模型。
据谷歌介绍,Nano Banana Pro在处理复杂信息方面表现出色,能够生成包含丰富上下文的信息图表,直观呈现天气、体育赛事等实时数据。其文本渲染能力也是一大突破,可以生成细节更丰富、文字更准确的图像,并支持不同风格、字体及语言的文本内容。无论是简短标语还是长段落文本,都能清晰、准确地直接渲染在图像中。此外,模型还支持在一个画面中融合最多14张图像素材和多达5个人物主体。
在编辑功能上,Nano Banana Pro引入了更高级的创意控制选项。用户不仅可以对图像进行局部选择与编辑,还能调整摄像机角度、添加背景虚化效果、改变焦点、进行专业色彩分级,甚至自由切换日夜光照效果。输出规格方面,模型支持多种长宽比,最高可生成4K分辨率的高清图像。
所有经由Nano Banana Pro生成或编辑的图像都将嵌入C2PA元数据,帮助用户更容易识别生成式AI内容及深度伪造。TikTok也在本周宣布将采用C2PA元数据为AI生成内容添加隐形水印。
尽管Nano Banana Pro图像质量显著提升,但其生成速度有所下降,使用成本也更高。原Nano Banana单张1024px图像生成费用为0.039美元;而Nano Banana Pro生成1080p/2K图像费用升至0.139美元/张,4K图像则为0.24美元/张。目前,免费版Nano Banana Pro用户拥有一定的使用限额,而Google AI Plus、Pro和Ultra的订阅用户则享有更多配额。美国的Google AI Pro和Ultra订阅用户可通过搜索功能中的“AI模式”使用该模型,全球NotebookLM科研助手用户亦可直接调用。
Nano Banana Pro正逐步集成至谷歌多项主流AI工具中,包括Gemini应用、Google AI Plus / Pro / Ultra订阅服务、搜索功能、视频工具Flow、Google Workspace等。面向开发者,该模型已开放接入Gemini API、Google AI Studio及谷歌全新集成开发环境(IDE)Antigravity。
当地时间8月26日,谷歌推出了最新的图像生成与编辑模型Gemini 2.5 Flash Image,代号“纳米香蕉”
2025-08-28 09:06:12谷歌旗下最强图像模型来了当地时间9月30日,OpenAI推出了一款全新社交媒体应用,这款应用基于升级版的AI视频生成器Sora 2。用户只需输入文本提示即可生成带音频的高清短片,并能上传视频至虚拟场景中与他人互动
2025-10-01 10:41:23OpenAI发布视频生成模型Sora2当地时间11月18日,Alphabet旗下的谷歌正式发布了迄今为止最强大的人工智能模型Gemini 3,并在发布首日将其整合到谷歌搜索、Gemini应用程序及多个开发者平台中
2025-11-19 07:57:25谷歌全新AI模型Gemini3发布谷歌DeepMind团队于5月27日宣布推出SignGemma,这是其迄今为止最强大的手语翻译模型,能够将手语转化为口语文本。该开源模型计划在今年晚些时候加入Gemma模型家族
2025-05-31 23:30:49谷歌DeepMind最强手语翻译模型登场11月27日晚,DeepSeek在Hugging Face上开源了一个新模型:DeepSeek-Math-V2。这是一个数学模型,也是目前首个达到国际奥林匹克数学竞赛金牌水平且开源的模型
2025-11-28 14:59:01DeepSeek上新首个奥数金牌水平模型