2013年11月12日,中国语音产业联盟“2013中国语音产业年会”在工信部支持下,将在北京举行,此次年会不同去年,捷通华声等国内所有智能语音企业、研究单位几乎悉数到齐,第一次真实展现国内语音产业的整体实力。
又见张连毅董事长,捷通华声近期一反过去低调作风,灵云开放平台一系列新技术、新产品精彩亮相,犹如打出一套组合拳,令产业界刮目相看:灵云开发者社区全面开放、推出识别率高达97%的灵云离线式语音识别技术、全面升级灵云智能客服系统、灵云英文语音合成技术达到国际水准。
由于比较熟识了,张连毅一见面就对笔者说:“最近出去参加了两个会,感触很深,与邻座交换了名片,竟都是用到语音合成、语音识别,还有其他的智能人机交互技术(HCI)的企业。”
张连毅感慨,以前出去参加的会也不少,多为介绍智能语音、HCI技术是什么,这次偶然间,就谈成了两个合作伙伴,可见,智能语音等人机交互技术已开始为广大用户所需要,也在一定程度上透露出HCI产业发展迎来了大好时代。
灵云服务2亿移动互联网大众
在这个早已是酒香也怕巷子深的年代,创建于2000年的捷通华声,作为一家民营企业,自主研发成功包括语音合成、语音识别、手写识别、光学字符识别、自然语言理解等多项HCI技术,并于2011年,创造性推出了国内第一个,也是迄今为止世界范围内最大、最全的智能人机交互技术开放平台—灵云(www.hcicloud.com)。十几年来,无论一直占据国内半壁市场的捷通华声语音技术,还是今天的灵云HCI各项能力,虽然深入到大众生活的方方面面,却如同幕后英雄不为人们所详知。
据介绍,就拿智能语音合成技术来讲,目前国内已经有超过一半以上的智能语音播报系统都在使用捷通华声灵云智能语音技术。从纵贯中国的高铁到各大飞机场;从各个医院语音叫号到各地长途汽车站;从建行、农行等各大银行声讯服务到各领域企业呼叫服务中心;从北京奥运会到上海世博会……不难想象,在人们日常生活的各个场景中,你听到的智能语音播报大部分都是捷通华声的声音。
纵观近期智能语音市场,风云变幻。两年前,苹果的Siri一鸣惊人,带动智能语音产业进入发展最快的时期。十几年来一直在语音合成市场占据主导地位的捷通华声、科大讯飞发力语音识别技术;百度、搜狗、腾讯为守住入口,凭借天然优势,重金砸出最高水平的语音识别技术;中科信利、云知声等老牌、新秀语音企业,迎来难得发展机遇期,一时间智能语音技术引发从未有过的关注,成为移动互联网产业中一个非常耀眼的亮点。
伴随着移动互联网的快速发展,捷通华声灵云也更加深入地融入大众生活,张连毅向笔者表示,截至目前为止,捷通华声灵云各项HCI技术能力已为超过2亿移动互联网大众提供轻松、便捷的智能语音等服务。
2亿捷通华声灵云大众用户,一个让人震撼的数字,张连毅给我们描绘了场景:当你外出使用手机进行地图导航;当你使用智能输入法或手写、或通过语音识别进行文字输入;当你坐在出租车上,听到悦耳的订车信息;当你休闲时,与手机聊聊天;灵云可能就在你的身边。或许人们更在乎的是体验,不知道也不了解背后的语音等HCI技术提供者,但不可否认的是,我们在不经意间或许早已体验过灵云HCI技术。
“低调”技术,“高调”服务
在谈到最近一系列的新技术、新产品强力展现,张连毅笑谈,由清华人创办的捷通华声公司在他看来,过去被清华校训“自强不息,厚德载物”给“害”了。原因就在于多年来捷通华声踏踏实实地专研技术,专注而务实,从不张扬;在市场拓展中,则安静地站在上千家的企业背后,全力里支持合作伙伴的发展,因此对外界的表现力上显得非常低调,一直不为社会大众所知,还经常忍受个别能“忽悠”企业的“挖苦”。然而,正是这种“低调”而执着的技术积累,捷通华声却得到广大合作伙伴的认同,无数成功的市场应用案例更促进捷通华声努力提升语音等HCI各项技术,低调与高调之间,作用悄然变化。张连毅说捷通华声的语音合成技术已“炉火纯青”,长期低调与合作伙伴合作,用于声音播报的语音合成技术则是“高调”服务中国亿万大众已达十三年之久。言谈之中,看得出伴随企业的强劲发展,张连毅更深刻体会到清华校训教诲的力量!
张连毅认为,其实,捷通华声“低调”的本质是尊重合作伙伴,捷通华声多年来始终坚持两个原则,一,让合作伙伴的产品“名声大噪”,不做“喧宾夺主”之事;二、不做合作伙伴同样的产品,不为“釜底抽薪”之举。如今,捷通华声灵云已全面向社会开放,在开放之初,捷通华声则已确定承继这一传统,并将这一理念通过与合作伙伴的技术与产品的融合推向更加务实与完美的境界。
百度语音识别与灵云语音合成完美结合,助力百度地图、百度导航掀起导航革命;灵云语音合成与搜狗语音识别更是精心设计,支持搜狗地图在导航领域独占一方霸主地位;独树一帜与拥有独特发展理念的导航犬,全面应用灵云语音识别、语音合成、语义理解、语音唤醒等功能,双方开发团队如同一个企业,日夜奋战在一起,为数以千万记的用户推出一项项精心设计的导航犬经典服务。
低调代表着一种态度,高调展示着一种信心,在张连毅看来,这也是对“自强不息,厚德载物”的一种诠释。
“低调”完美演绎智能语音等HCI技术能力服务,“高调”为所有合作企业的经典产品与市场进步而喝彩! 正如张连毅所说,中国的企业应形成并发挥自身特色,一起建设产业生态系统,真心认同并推动合作共赢,实现产业的共同发展。
灵云首创“云+端”理念,全方位演绎智能语音
据了解,为满足用户在使用不同设备、在不同应用场景下,都能享受智能语音交互等HCI技术的方便与快捷,捷通华声灵云平台面向开发者提供包含“云 + 端”语音识别、“云 + 端”语音合成、“云 + 端”手写识别等各种HCI技术能力的一体化HCI解决方案,不仅能够全面系统地满足企业与设备开发商的需求,同时也能够更好地为用户提供个性化的服务。
站在企业用户的角度,每个企业的设备不同、性能不同、应用网络环境不同,企业在应用HCI技术进行创新“智”造的过程中,如果有更多的选择,就能更好的满足大众用户;站在大众用户的角度,每个人都希望全面享受智能语音等HCI技术最好的服务,却不希望受到网络环境等因素及付出“高昂”费用。
灵云开放平台凭借捷通华声十几年的功底,语音合成、语音识别技术无论在“云”还是“端”,用户均可以轻松调用。灵云语音合成播放轻松自然,尤其值得指出的是,灵云可让合作伙伴选择适合于自身应用的多种声音,并提供中文普通话、粤语(广东话)、维吾尔语、英语、德语、法语、俄罗斯、西班牙、日语、韩语等在内十几种语言的语音合成能力;而语音识别因其对硬件资源的特殊要求,实现“端”识别对技术提出更高的要求,灵云离线式语音“端”识别以识别率高、定制简单等特点,与灵云语音合成一起为用户提供几乎完美的智能语音“云+端”服务。
张连毅讲到:“灵云率先推出‘云 + 端’服务模式,是捷通华声的一种理念,一切为用户着想,即‘舍弃’云端服务可以获取所谓宝贵数据资源与用户资源等利益,满足用户甚至在没有网络的环境下,仍然能够方便使用智能语音技术能力,也让数以亿计的大众不必为‘高昂’的流量费买单,轻松享受智能语音等HCI技术能力的服务。”
一项好的智能人机交互技术简单来说,就是让机器更好地“读懂”用户的意图。随着语音识别率地提升,在确保识别率的前提下,对于噪音的处理就显得尤为重要。在噪音环境中,有一项技术不可或缺,它就是语义理解。张连毅称:“灵云语义理解可对输入语音的语义进行分析,保证识别率的同时,也确保语音合成播报使用者需要获得的准确信息。”
据了解,灵云“云 + 端”自推出以来,迅速为产业所接纳,不仅提供智能语音技术于导航领域,百度语音助手、搜狗语音助手、聚熵360、南京米果、虫洞语音助手等系列语音助手软件;天行输入法、百度输入法、触宝输入法,也包括“汉字英雄”、汉字书写大赛更是将智能语音、智能图像“云 + 端”及其合作模式,超乎想象地完美应用。
随着智能语音技术引发关注,智能语音“互联网入口说、关卡壁垒说、大数据说、资本说”等各种说法风靡IT产业,甚至最近又出现了“血统说、家族说”。面对众多学说,张连毅则一笑了之,只淡然说了一句:“说一千,道一万,语音识别、语音合成其实就是‘工具’,一个人与机器交流的工具。”即无论什么时候,智能语音交互最主要的核心功能还是一个声音录入与输出的工具。张连毅介绍说,智能语音技术差不多每十年就“热闹”一场,他相信:当智能语音更加实用,也充分满足了大众的好奇之后,很快会象过去一样回归到自然与纯朴——在这个领域中,有心的,会安心提高语音识别准确率、语音合成自然度,关注用户使用与体验;炒作的,一定耐不住这种技术螺旋式进步的“寂寞”,受不了“只有更好、没有最好”的刺激,也会悄然退场。
合作共赢,促进中国语音产业发展
谈到将要举办的“2013中国语音产业年会”,张连毅并不隐瞒对语音产业联盟过去的失望,及对未来已拥有的很高期望。去年,在工信部支持下成立的中国语音产业联盟,却只有一家专业语音企业,包括捷通华声、中科信利、得意音通等专业语音公司,及百度、腾讯等从事语音技术应用的大型互联网公司,甚至清华大学实力强悍的语音研究机构均被“莫名其妙的挡在外面”。张连毅说,这次年会,很高兴看到工信部相关领导与相关部门的高度重视,并深入到国内所有语音企业、研究机构中调研,充分听取各方意见,促成了一个真正集“产、学、研”一体化,几乎容纳所有语音技术领域相关企业与研究单位参加的语音产业联盟的诞生。
张连毅认为,语音等HCI技术产业拥有巨大的发展空间,要跳出“狭小”的空间,要拥有与发展大产业相匹配的博大心胸,更不要“搞山头”,“拉派系”,市场竞争不同于学术讨论,服务市场与广大用户才是实力的最好体现。自“863”计划开始,国家已在语音技术领域投入了巨额的科研基金,也可谓硕果累累,如今几乎所有的语音企业也都多少享受到这些成果,此乃国家远见之举,产业发展之幸!而得到国家直接支持最多的企业或者机构,也应想到,伴随智能语音产业的发展,支持社会产业发展,回馈社会,回馈大众是义不容辞的责任与义务。
谈到捷通华声未来发展,张连毅表示:“捷通华声将致力发展灵云开放平台,灵云不会发展单一技术能力,将在发挥语音识别、语音合成等多项HCI技术优势的基础上,不断与学术界、产业界合作,推出更多的HCI技术能力,让人机交互像人与人沟通一样的简单自然,促进合作共赢成为HCI产业融入中国IT产业的主旋律。”
今年,捷通华声灵云已设立1000万发展基金,半年来资金的使用,包括对国内各种HCI技术各种学术会议的支持已取得非常好的效果。如果哪家科研院所、或者企业有新的HCI技术,灵云都可以为其提供平台支持、资金与市场支持,灵云的目标是融合所有成熟的HCI技术,并向社会全面开放,坚定支持中国实现从“中国制造”向“中国创造”的历史性转变。张连毅最后强调说:“相信未来发展,智能语音等HCI技术依然会呈现螺旋式进步趋势,无论智能语音、还是智能图像,抑或生物识别。没有最好,只有更好;只有合作,才会更好!”