胡郁现场演讲图
段建军现场演讲图
中国网娱乐9月22日讯 对于不少“开车族”而言,手机内的语音导航可谓是必不可少的行车神器,为了响应市场需求、增添语音导航的新鲜感,部分导航类app更是邀请到林志玲、郭德纲、罗永浩等圈内明星为该款应用站台“献声”。有了这样一款系统,用户不但能解决行车途中可能遇到的路况烦恼,还可以享受到“私人订制”的语音导航服务。那么问题来了,语音导航如何做到识别每一条街道、每一个地名?录制这样一款复杂的语音系统需要耗费多长时间?在即将播出的新一期《未来架构师》中,科大讯飞执行总裁胡郁与“汽车行业领跑者”段建军,以“世界无边界”为主题,带领观众走进近未来的人机交互世界!
智能语音竟可“私人订制” !“人机大战”是否能捍卫人类最后尊严?
在本周日晚播出的第十期《未来架构师》中,科大讯飞执行总裁胡郁就将在节目中与观众分享研发语音识别技术的艰辛成长史。
中国有九大方言语系,其中细分的方言有几十甚至上百种,且由于地域的差异,人们说话的方式更是南腔北调。最初,科大讯飞为了让机器人听懂不同口音的人说话,便设计出了一套名为讯飞语音的输入法,人们只需将此输入法装在智能手机上,就可以通过语音识别技术,直接将其转换成文字;可在当时,输入法的正确率仅仅只有百分之五十五,面对这一问题,科大讯飞并没有选择放弃,而是不断的致力于提升语音识别技术,通过不断的努力,如今其系统已经收集了成千上万上亿小时的数据,正确率可以达到百分之九十八。
“我们所接触到的所有汉语音节都是由特定的声母、韵母和不同的调性组合组装在一起的,即使我们的语言千变万化,但常用的音节却不超过三千个。”在本周日晚播出的第十期《未来架构师》中,科大讯飞执行总裁胡郁就关于“明星和艺人如何进行复杂的语音录制”这一问题给出了相应的解释;“我们的团队根据此种情况,专门设计了一个标准的‘库’,它能尽可能地覆盖每个人在不同情况下的音,配音者只需要用一小时左右的时间,把一篇文字按要求朗读一遍;我们的程序会通过机器去学习他们的嗓音,这样就能够得到一个可以讲任意文字信息的语音系统了。”胡郁说。