如果你曾经使用过苹果的语音助手“Siri”,一定对“我也不知道这个问题的答案呢”的回答耳熟能详。但对于只能用语音来控制的智能音箱,消费者显然对这样的回答并不满意。因此,智能音箱是不是好用,完全看它是否够“聪明”。比如说,当你要它“播放一首不同的歌曲”,它一定不会给你播放一首名叫《不同》的歌。
从实际体验看,因为有人工智能的算法支持,智能音箱对语言的理解让人惊讶,无论是问“今天热吗?”“今天会下雨吗?”还是“今天气温是多少摄氏度”,市场上的主流智能音箱均能理解这是在询问天气,并可根据不同的问法来优化答案。阿里人工智能实验室负责人陈丽娟表示,中文语音交互难点在于中文的语义理解,人工智能的算法支持让中文语义理解引擎能够对常用的定时、提醒、天气、购物等语言内容优化。“天猫精灵仅在天气预报上就能够理解786种中文问法。此外,对北方语言的儿化音,小朋友的叠字,包括吞字、缺字、口头禅,这些都可以通过深度机器学习来优化。”
“够聪明”的智能音箱还具有一些意料之外的功能。比如,天猫精灵可以直接与用户的支付宝账户打通,利用声纹识别为手机充值,并可以通过拨打电话帮助寻找用户的手机,问问音箱则在多轮交互上表现良好,比如同样是问天气,就可以直接问“北京天气如何?”“那石家庄呢?”“那后天呢?”它都知道你在询问天气。
此外,考虑到用语音控制且门槛低的特性,智能音箱还把不识字不会操作智能手机的儿童也视为其目标用户。讲故事、唱儿歌、说笑话……大部分智能音箱具备了种种与儿童互动的功能。小米AI音箱甚至专门设计了一个“听听它们怎么叫”的功能,当你询问“大象怎么叫”,它就会播放出大象的叫声。
语音交互“演兵场”
智能音箱能够实现的功能颇为丰富,但做一款畅销的产品,并非巨头们集体入局这个市场的最主要原因。“互联网或语音技术公司醉翁之意不在酒,他们的算盘是用智能音箱来推广自己的语音交互技术。”人工智能服务商思必驰首席市场官龙梦竹说。
的确,如果说智能手机的触摸屏改变了人与智能设备的交互方式,那么语音交互则被认为是下一代人机交互方式,智能音箱就是语音交互的第一个入口级产品。出门问问创始人李志飞表示:“人工智能和语音交互是灵魂,但需要为灵魂找个载体,尽管这个载体不见得就是音箱,但智能音箱相较之下最容易推广。”