OpenAI新模型最全解读：科幻照进现实，有情绪的AI出现了

小大

用微信扫描二维码
分享至好友和朋友圈

关键词：

2024-05-14 07:51:45 腾讯网

OpenAI最近发布了万众瞩目的新成果，其中核心亮点是多模态模型GPT-4o，伴随着ChatGPT的新用户界面和桌面版GPT的亮相。GPT-4o标志着人机交互更进一步，特别是在理解及生成文本、音频、图像方面展现了前所未有的能力，且在视觉理解和音频翻译上达到了新高度，尤其擅长处理小语种语言。

新模型的特性令人印象深刻：它能即时响应，音频输入的处理时间低至232毫秒，接近人类对话的速度；它在电脑桌面上的实时在线功能意味着用户可以随时获得帮助，无论是编写代码还是分析图表，极大地提升了日常工作效率。GPT-4o的“全知”特性（"o"代表），意味着它能够整合处理不同形式的信息，实现无缝的交互体验。OpenAI新模型最全解读：科幻照进现实，有情绪的AI出现了。

相较于前代模型，GPT-4o在非英文文本处理上有了显著进步，且API速度更快，成本降低了50%。它的端到端处理机制允许所有输入和输出由单一神经网络完成，区别于以往需多个模型串联的繁琐流程，这不仅提升了效率，也增强了模型对输入信息的理解深度和广度。

OpenAI的这一创新直接挑战了现有的语音助手模式，通过GPT-4o，用户可以享受到几乎无延迟、富含情感互动的AI伴侣，它不仅理解用户的言语，还能通过视觉捕捉环境信息，进行情境化的互动。桌面版的应用进一步扩展了其功能，如即时代码审查和文档摘要，使得AI的辅助更加直观和便捷。

值得注意的是，GPT-4o不仅能识别情绪，还能根据感知到的情感作出相应反馈，这种“情绪智能”为AI与人的沟通增添了前所未有的真实感和沉浸感。此外，模型还展示了诸如生成3D模型、图像诗歌创作等多样化的创意能力，预示着多模态AI的潜力远超当前所展现的范畴。

至于用户最为关心的可用性问题，OpenAI宣布GPT-4o即日起在ChatGPT中逐步推出，免费版用户也可享受其服务，Plus用户则享有更高的消息限制。开发者亦可通过API访问，享受速率提升和成本降低的双重福利，未来几周内，更多包含音频和视频能力的更新将逐步面向信赖的合作伙伴开放。

总之，GPT-4o的推出不仅是技术上的飞跃，也为用户带来了更自然、高效、贴近人类交互习惯的AI体验，预示着AI技术正逐步融入并丰富我们的日常生活。

(责任编辑：卢其龙 CN070)

关闭

OpenAI新模型最全解读：科幻照进现实，有情绪的AI出现了

相关新闻

今日热点

频道热点