“给XX发条短信,告诉他明天俺过去拜访”,当我们对着我们的智能手机像对着管家说话,而且它灵活地完成时,这才能够满足我们目前对于手机语音的想象。而我们现在所使用的手机语音呢如何呢?似乎和我们在宣传、广告上看到的效果很不一样,经过多年的发展演变,手机语音已经成功地从一个令人眼前一亮的新颖功能变成了现在让不能再爱了的样子功能。那么,是什么隔开了现实与想象?
在谈论阻碍之前,我们先来看一下网友们的对于手机语音的看法。
针对目前手机语音的现状,小编在手机之家的官方论坛以“手机语音 你用吗? 好用吗?”为话题做了一番调查。从手机之家网友的回复上可以看出,绝大多数的网友对与手机语音的评价是负面的,对于使用好坏与否已经不以为意了。小编截选了几个富有代表性的网友回复。
总结下来,用户对于手机语音的意见还是集中在“听不懂”和“听不明白”。
这个隔开现实与想象之间的鸿沟很明显还是技术,“给XX发条短信,告诉他明天俺过去拜访”似乎很简单,手机语音对这句转换能实现了吗?没有,做到如此不是很简单吗?不然。小编在开头抛出的这句话,事实上透出了目前手机语音的两大瓶颈,智能性和识别率,也就是听得懂和听得明白。
智能性
智能性这个词说起来玄乎,实则随处可见,比如我们在调戏Siri时,玩的就是其智能性。小编在开头提到的这句“给XX发条短信,告诉他明天俺过去拜访”,这句话并不是类似于“打开短信”这样的生硬命令,而是再用一种人和人的沟通方式向手机下命令,也就是我们日常使用的自然语言。
调戏siri
我们可以解释为这是一个理解你的意思的手机语音系统,它不仅不会限制用户如何说这个话就能知道你是什么意思,在会话中能够根据语法甚至是语境来识别用户的意思,是为自然语言处理。
手机语音何时能理解?
但是目前的手机语音的智能性还仅限于固定词组,固定词语顺序语句的命令,手机语音系统在识别你说的话之后,通过从中寻找词语key来完成理解,这对于我们所想象的手机语音来说是低级的。很难想象你站在人群中对着手机喊一句“打开短信”时,人们会是用一种怎样的眼神看着你。
正是基于这样一种道理,手机语音发展的下一步就是能够识别、处理自然语言,这对于未来来说是巨大的一步,对于现在来说则是一个生长的瓶颈。
识别率
在开头的那句“给XX发条短信,告诉他明天俺过去拜访”中称呼自己的是“俺”字,这对于目前的手机语音来说已经不是难事,识别出来并不困难。但是性别、年龄、口音、音调、节奏等等因素都影响影响着识别率,一个“俺”字所表示的是手机语音系统对同一种语言多样表达的无力。
手机语音
而这并非是一个识别率低的问题,事实上目前主流手机语音系统的识别率并不低,平均达到了90%以上,但是是在一个理论上的标准语言环境下,也就是想要使用好手机语音系统,你不能带口音,更不能带方言。而但就我们来说,幅员辽阔的中国,仅就普通话就有多种方言来展现,难度之大可以想象。
中国方言分布
虽然科技是持续进步的,但这两大限制手机语音向前发展的大山,一时间还难以撼动。能够理解的自然语言的手机语音系统,必然是基于一个有着质的飞跃的逻辑,而针对不同语调、口音等问题的处理需要庞大的语言信息库,还要使手机语音系统具备一定的学习能力,这一切都任重而道远。然而同样是因为科技是持续进步的,我们有理由乐观,因为那一天迟早会到来。