当前位置:新闻 > 经济新闻 > 正文

海云数据创造“读唇术”:看嘴型识别发音

2017-03-31 17:33:11    中国网  参与评论()人

声音是人类感知世界的重要渠道,然而在特定的无声场景中,声音的传播属性被强制剥离,形成信息真空。将失去的声音还原成信息流,并用文字可读的方式再造场景成为迫切需要,唇语识别技术由此而生。

2017年3月29日,海云数据创始人兼CEO冯一村在亚洲大数据可视分析峰会上,发布了重庆市公安科研所与海云数据共同研发的唇语识别技术成果。

1

【海云数据创始人、CEO冯一村发言】

冯一村介绍:自2016年12月以来,海云研究院经过多项技术攻关,结合海云数据业务形态、唇语识别的核心技术及应用进行了深度探索,打破了原先只能识别英文的技术局限,开创了中文唇语识别模型的研究先河,并取得了一定的成果。经过实践评估,中文识别模型准确率已达到70%。

神奇却不神秘的唇语识别

唇语识别并不神秘,早在几年前,国外就已提出相关概念,但更多是存于构想阶段。实质上,唇语识别是一项集机器视觉与自然语言处理于一体的技术。唇语识别系统使用机器视觉技术,从图像中连续识别出人脸,并提取此人连续的口型变化特征,随即将连续变化的特征输入到唇语识别模型中,识别出讲话人口型对应的发音,从而计算出可能性最大的表达语句。

关闭