前DeepMind大佬创业,做出喜怒哀乐以假乱真的AI语音大模型!美国情感智能技术AI创企Hume AI于2月27日发布了新款文生语音大模型Octave。该模型可以根据用户输入的提示词或剧本,生成具有人设特点、语调起伏和情感色彩的AI语音,并允许用户通过文本指令进行二次调整和创作。Hume AI由DeepMind前研究员Alan Cowen于2021年创立,最近一轮融资后估值为2.19亿美元。
Alan Cowen在接受VentureBeat视频电话采访时介绍,Octave能够理解上下文中的词汇,并预测适当的情绪、节奏、韵律和重音,使AI语音听起来更加人性化。相比过去机械化的AI语音,Octave旨在让AI语音更有人情味。这些AI语音不仅带有愤怒、悲伤或快乐等情绪,还能将多种情感交织在一起,例如“夹杂着幽默或恼怒的轻度沮丧”。Cowen认为,该模型适合用于有声读物、播客、视频画外音和视频游戏角色配音。
Hume AI在社交媒体平台X上详细说明了Octave的具体功能和训练过程。据透露,用于训练Octave的语言数据是传统文生语音大模型的1000倍,这使得Octave能够像人类演员一样理解剧本,并使用更逼真的情感、语义、节奏、词语和重音。其训练数据中包含了数百万小时的公开长篇语音数据和Hume AI独家采集的声音、视频数据。除了文生语音大模型,Hume AI还在利用Octave训练AI系统,以更好地预判用户的AI语音生成需求。
在一项人类评审盲测的对比实验中,Octave的输出在音质、自然度以及语音生成与预期描述匹配度等方面均优于ElevenLabs,表明其AI语音生成过程的可控性和质量高于行业水准。在推出Octave之前,Hume AI已推出了两代自研的同理心语音界面(EVI),声称EVI是第一个具有情商的对话式AI。
当地时间11月6日凌晨,特朗普在佛罗里达州棕榈滩会议中心发表讲话。华尔街投资大佬比尔·阿克曼此前在为特朗普拉票时呼吁选民不要只看特朗普这个人,而是要看他背后的整个团队
2024-11-07 14:05:10特朗普竞选团队都有哪些“大佬”减产已经成为瑞士制表业的共识。上市公司、瑞士历峰集团董事主席兼创始人Johann Rupert日前在年度股东大会上表示,奢侈腕表行业必须减产,以应对贵价时计需求的减少。
2024-09-13 16:45:40瑞士制表业大佬呼吁必须减产