亚马逊推出了新一代生成式AI语音模型Nova Sonic,在人工智能语音领域取得了重大突破。这款模型能够处理语音输入并生成自然流畅的语音输出,其速度、语音识别准确率和对话质量等核心性能指标已达到与OpenAI、谷歌等科技巨头尖端语音模型相媲美的水平。
Nova Sonic通过亚马逊Bedrock开发者平台提供服务,采用创新的双向流式API接口,为企业级AI应用开发提供了强大支持。该模型在成本效益方面具有显著优势,价格比OpenAI的GPT-4便宜约80%,成为市场上最具性价比的AI语音解决方案之一。
相比竞争对手,Nova Sonic在将用户请求路由到不同API方面表现出色。它能够判断何时需要从互联网获取实时信息、解析专有数据源或在外部应用程序中采取行动,并使用合适的工具完成任务。在双向对话中,Nova Sonic会等待合适的时机发言,考虑到说话者的停顿和打断等情况。此外,该模型还能为用户的语音生成文本记录,这些文本可以用于各种应用场景。
亚马逊AGI部门首席科学家罗希特·普拉萨德透露,Nova Sonic的部分技术已经应用于升级版数字助手Alexa+。该模型的推出是亚马逊构建人工通用智能(AGI)战略的重要一步,未来还将推出支持多模态理解的AI模型,涵盖图像、视频及其他物理世界感知数据。
芯片巨头英伟达正在拓展印度市场,这是一个不断增长的人工智能技术市场。10月24日,英伟达在印度推出了一款轻量级人工智能模型,该模型适用于广泛使用的印地语
2024-10-24 20:46:00英伟达拓展印度市场OpenAI首席执行官山姆·奥特曼当地时间1月17日在社交媒体平台X发文称,OpenAI已完成新推理AI模型o3 mini版本,将在几周内推出
2025-01-18 11:24:13OpenAI将推出推理AI模型4月12日,据外媒报道,字节跳动正计划推出一款AI智能眼镜。这款眼镜预计将配备类似自研模型豆包的AI功能。知情人士透露,字节跳动从去年开始开发这一项目,新招聘的硬件设计工程师也参与其中
2025-04-12 15:30:27字节跳动计划推出AI智能眼镜太平洋时间周一晚上8点(北京时间周二中午12点),马斯克旗下的人工智能初创公司xAI将发布其聊天机器人Grok 3,马斯克会进行现场演示。此前,马斯克曾称Grok 3为“地球上最聪明的人工智能”
2025-02-18 12:41:37马斯克正式发布AI模型Grok3