随着OpenAI在2024年5月14日的展示,GPT-4o这一多模态大模型产品进入了公众视野,标志着信息获取方式可能迎来变革。这款被蚂蚁集团副总裁徐鹏誉为在超自然交互领域取得巨大进步的工具,集视觉、音频理解等技能于一身,其“全能”(o代表omni)特性让人联想到电影《她》中描绘的人机情感互动未来。
GPT-4o的核心竞争力在于其实时多模态处理能力,能够迅速在音频、视觉和文本间进行推理,输入输出形式多样,响应时间贴近人类对话速度。OpenAI的CTO米拉·穆拉蒂强调了该模型的即时性和情感感知能力,预示着更自然的人机交互将成为现实。
尽管业内有人对GPT-4o持保留意见,如猎豹移动CEO傅盛指出的,它未完全满足人工智能领域的期待,但他也认可GPT-4o通过整合多种交互模式,减少了用户在不同媒介间的切换,特别是其语音助手功能,展现了端到端大模型技术在情感感知与适时回应上的潜力。
徐鹏在采访中阐述,GPT-4o相较于GPT-4的显著提升在于多模态的深度整合及快速响应,这不仅要求高超的数据组织与工程优化,也为交互设计开辟了新天地。他指出,OpenAI正朝着语音与语言理解深度融合的方向努力,GPT-4o正是这一路线的产物,其能力基础可追溯至早期的自动语音识别系统Whisper。
在谷歌推出Gemini模型后,OpenAI与之在原生多模态技术的竞争加剧。原生多模态模型的训练涉及音频、视频、图像等多种数据,与“拼凑多模态”模型形成对比。GPT-4o的推出,展现了OpenAI在工程实现上的显著进步,尽管背后强大的算力需求和高昂成本也引发了业内的讨论。
科技投资人熊伟铭推测,GPT-4o的成功离不开庞大的计算资源支持,同时也提出,未来如GPT-5的发展可能会面临更多挑战,尤其是在成本与技术创新的平衡上。
北京时间周二凌晨1点,OpenAI召开了春季发布会,由首席技术官米拉·穆拉蒂主持,为市场带来了几项与ChatGPT相关的重大更新
2024-05-14 07:24:51OpenAI发布GPT-4oOpenAI近期在首次春季新品发布会上,震撼推出了新一代旗舰生成模型GPT-4o及配套的桌面应用,展示了前所未有的交互能力,这一系列革新不仅技术领先,更是对传统产品形态的颠覆,让全球科技界为之侧目
2024-05-14 23:01:54GPT-4o完全免费北京时间周二凌晨1点,OpenAI举办了一场春季发布会,向公众展示了一系列与ChatGPT相关的创新。发布会核心内容包括发布新旗舰模型“GPT-4o”以及在ChatGPT中增加更多免费功能
2024-05-14 09:26:23OpenAI推出新旗舰模型GPT-4o5月14日深夜,美国OpenAI公司举办线上“春季更新”活动,揭晓两大核心内容:发布最新旗舰模型GPT-4o及在ChatGPT服务中增添多项免费功能
2024-05-14 07:49:16OpenAI新模型:丝滑如真人在周二凌晨1点的春季发布会上,OpenAI继“文生视频模型”Sora后再次为市场带来新惊喜
2024-05-14 09:07:05OpenAI新模型:图文音频全搞定