深圳CITE 2014会展期间,笔者有幸与云之声CEO黄伟进行了一次深入的沟通。云之声是在语音识别领域刚刚创业不就的公司。如今已经可以和科大讯飞这种资深公司相媲美,创造了语音识别行业的一个神话。其CEO黄伟也才刚刚走马上任不久,去年12月梁家恩退位让贤,转而主要负责技术领域。
黄伟:曾经就职于摩托罗拉和盛大创新院,建立了盛大创新院语音分院,后随着盛大整体战略的调整,他于2012年离职选择创业。可以说同样是从幕后走向前台,语音识别业内,可以用黄伟回归来进行描述。
在这些大背景下,黄伟带领云之声黑马式崛起,先后进驻车载领域和智能电视领域。黄伟表示其公司下产品线有多条,每一条盈利都在千万级别。
语音识别产业的爆发
语音识别领域并不是才刚刚起步,几年前各家厂商已经在其手机上预置语音功能。识别率最近也大大提高,从前些年的70%到如今可达到95以上。平布哦Siri也推出两年多时间了,今年苹果在麻省理工大学 (MIT)附近组建神秘办公室,用以做Siri 语音识别技术的研发。微软正在研发代号为“Cortana”自有语音个人助手软件,并计划在下一个Windows Phone平台大升级中推出,以抗衡Google Now及Siri。至此,苹果、谷歌(微博)、微软、英特尔等国际巨头均重金投入语音识别技术。
在最近几个月中,各家都在全力研究语音听写引擎。云功能的不断完善。国内外不断涌现致力于语音识别的公司不断崛起。竞争进入了白热化程度。不同种类的语音服务软件、语音识别插件应运而生。从指尖转向舌尖,从手机专项汽车、智能家居等不同方面。一场人机交互变革正在酝酿。
不仅仅识别普通话
黄伟表示,随着4G的快速发展,对于语音识别技术同样是个很大的机遇。快速的网络可以无缝隙的与云端数据库对接。识别更快,交互更流畅。而且如今不仅仅可以识别普通话,随着技术的成熟,语音识别目前可以识别普通话、广东话、四川话等几大语系。而且仅仅普通话就可以分为标准普通话、山东普通话、河南普通话等等。根据各地不同的语音语调进行识别,所以95%以上的识别率涵盖的意义已经不可以用几年前的标准来衡量了。
云之声未来的机遇与挑战
语音未来的应用场景很有可能是走“软硬”结合的路子。包括Siri捆绑在苹果产品中,以及GoogleNow在谷歌系硬件产品中存在一样,与智能穿戴、车联网设备相连或许才是语音行业的破局方向。2013年,云知声的智能终端交互方案已经在智能电视、车载、可穿戴设备上有知名成功应用案例,凭借积累的优势和发展经验,2014年云知声将继续在智能终端以及智能客服等领域深耕细作,步步为盈,云知声语音识别引擎也将迎来升级,除了支持普通话识别之外,还将支持粤语和英语的精准识别。