日前手机淘宝对外透露了其即将上线的最新版手机淘宝客户端应用(IOS3.4.5、安卓3.9.5)的一些核心创新功能,其中包括目前国内最先进的语音搜索购物功能。据透露,手机淘宝语音搜索的识别率可高达93%,不但支持正常环境下的自然语音输入,还支持在地铁、车站、广场等复杂的噪音较强环境下的语音识别,中英文商品品牌混着说也无压力。
手机淘宝方面表示,该技术处于国内领先地位,目前国内其它同行的语音搜索技术的识别率大都在85%以下,而手机淘宝这一技术的识别率高达87%以上。尤其是在针对商品方面,手机淘宝的语音搜索技术识别精度更高,达到93%。
记者在手机淘宝的测试版上抢先对该功能进行了体验,分别尝试查找“红色的iphone五手机壳”,“速腾车的防雨布”,“章子怡出席金马奖穿过的裙子”,“给我来一包香烟”等复杂的商品词语和句子,都能够准确获得相应的商品信息。
在测试一些长句子如“给我来一包餐巾纸”这样的内容时,记者发现手机淘宝还会自动提取句子中的商品词语“餐巾纸”,并根据这个提取的商品中心词进行搜索和推荐。由此也能看到手机淘宝除了在语音识别技术领先行业外,还十分注重对产品“智商”的培养。
手机淘宝方面介绍,这项技术还使用了国内最先进的防噪音处理技术,用户即使是在地铁、火车站这样喧嚣、嘈杂的场景,也能够轻松识别用户需求,并帮助用户通过手机淘宝搜索并购买到自己想要的宝贝。
据淘宝语音算法专家介绍,手机淘宝目前已经具有自主研发和改进语音算法的能力,并使用了最先进深度神经网络方法,这种算法模拟人脑学习过程,对数据尤其贪婪。据透露,手机淘宝在神经网络模型训练即吃数据方面的能力不仅从量还是速度都是国内领先的,而且使用深度神经网络技术在常规语音识别技术基础上错误率减少40%之多。随着在淘宝购物场景用户使用的不断积累,语音在购物场景的识别率还会进一步提高,形成绝对技术壁垒。
中英文混说情况的识别在语音领域是一大难题,比单纯英文或中文的难度都大很多,手机淘宝在这方面做了很多优化工作,成为为数极少的具备这种能力的团队之一。记者试了几款产品的语音功能,只发现讯飞语音产品有类似功能。而由于商品品牌很多都是英文词,这项功能对于语音搜索是非常必要的。据悉随着产品上线和语音数据的积累,手机淘宝在中英文混说的识别能力仍在不断优化。
语音服务最早源于电话服务台的天气咨询热线,后来逐渐扩展到企业的用户服务客户专线,语音软件Siri与iPhone 4S让这一技术和服务成为流行,不过由于中文的复杂性,即使是Siri也无法完全满足国内用户的需求。而国内其它一些推出语音搜索的公司则始终为识别率所困扰。
手机淘宝负责该功能研发的解风表示,未来还将继续改进这一服务,进一步提升语音搜索的准确性。他还表示,如果有可能的话,还有可能推出能够搜索方言的服务。