以发音口型为例,为生成真人听感的发音,京东云自研轻量级对抗语音合成技术,结合深度神经网络进行个性化建模,达到音色丰富、特色鲜明的语音合成效果,甚至可以模拟人的呼吸和停顿;为匹配准确口型,京东云基于大量语音数据,特意设计鲁棒的语音特征,使其可以被不同音色、语言和语速的合成语音驱动,保持准确、连贯的口型。
面向未来,京东云助力产业数智化转型
虚拟数字人正在实现不同领域的应用落地,从线下银行的虚拟柜员,到线上购物的虚拟主播、娱乐圈的虚拟偶像,甚至元宇宙里的虚拟化身,虚拟数字人也将彻底颠覆我们对于生活、工作、娱乐的体验方式,成为人和人、人和物的交互载体。通过数字人,以多模态创新的方式来生产、传播内容,也将建立数字内容的新范式。
京东云将基于深厚的产业数智化实践应验,推动虚拟数字人与产业的深度融合,打造以虚拟数字人为载体,以语音合成、文本创作、视频加工、批量合成、智能审核等人工智能技术为依托,创新、高效的数智供应链,树立人机交互发展、应用的新标杆,助力实体经济高质量发展。