GPT-4o新模型会代替Siri吗全能AI助手时代来临？

小大

用微信扫描二维码
分享至好友和朋友圈

关键词：

2024-05-14 22:58:20

GPT-4o新模型会代替Siri吗

OpenAI在5月14日的凌晨发布了一项重大突破——GPT-4o，这款新模型彻底改变了大型语言模型的交互方式。GPT-4o实现了音频、视觉和文本的实时推理，其语音响应时间仅为232毫秒，与人类反应速度不相上下。在无延迟的语音对话中，它的表现如同真人，无论是节奏、语气还是对幽默的把握，都令人难以区分。视频交互亦是游刃有余，展现了前所未有的流畅性。

GPT-4o的全称为“Omni”，意指全能，它能够处理文本、音频和图像的混合输入，输出形式同样多样。尤其在音频输入上，GPT-4o解决了长久以来智能语音助手的延迟问题，平均响应时间仅为320毫秒，最短可达232毫秒，真正做到了与人同步。其对话中展现的高度理解和适应性，包括自然的语音、多种语气词的运用，以及对对话中断的灵活处理，都极大地模糊了人机界限。GPT-4o新模型会代替Siri吗。

视频互动方面，GPT-4o能够即时响应视频指令，如迅速解答数学问题，同时具备快速解读图片信息的能力，例如细致分析气温图表。它还展示了多语言能力，能说意大利语，并具有记忆功能，能从过往对话中学习。在情感识别上，GPT-4o不仅限于文本，还能在视频中准确感知情绪，比如正确判断提问者的情绪状态。

技术层面，GPT-4o创新性地采用单一神经网络处理所有类型的数据输入，无论文本、图像还是音频，均能高效解析并回应，这标志着对传统多模型处理方式的重大革新。

OpenAI宣布，未来约一个月内，Plus用户将率先体验到基于GPT-4o优化的语音服务，预示着个性化服务和用户体验将迎来质的飞跃。与此同时，OpenAI采取了一系列普惠措施：GPT-4o的新功能将对所有用户免费开放，包括高级功能如视觉解析、联网、记忆及代码执行等。此外，模型的API也将同步公开，性能显著提升，成本大幅降低，消息限制放宽，为开发者提供了极大的便利。

值得关注的是，OpenAI发布了ChatGPT的桌面版本，旨在简化用户与AI模型的互动，强化以用户为中心的设计。这些动作被视为OpenAI推动AI普及化承诺的体现，同时也显示出其面对行业竞争的压力和增长的渴望。

尽管面临数据来源透明度和安全性的考量，OpenAI承诺将确保GPT-4o的安全使用，例如限制音频输出为预设声音。关于GPT-4o的训练数据，外界推测涉及大量自然对话场景，具体细节预计将在后续的AI系统卡中公布。

总而言之，GPT-4o的发布不仅推进了全能AI助手的梦想，也为人机交互树立了新的标杆，预示着AI技术应用新时代的到来。

(责任编辑：卢其龙 CN070)

关闭

GPT-4o新模型会代替Siri吗 全能AI助手时代来临？

相关新闻

今日热点

频道热点

GPT-4o新模型会代替Siri吗全能AI助手时代来临？