已在今年斩获八项“世界冠军”的科大讯飞再加一冠,在近日刚结束的2018年国际口语机器翻译评测比赛(International Workshop on Spoken Language Translation,简称IWSLT)中,科大讯飞以在英德方向语音翻译任务上端到端模型(End-to-End Model)显著优势获得第一,基线模型(Baseline Model)获得第二的优异成绩,充分证明了自身在语音翻译领域的国际领先地位。
IWSLT是国际上最具影响力的口语机器翻译评测比赛,每年举办一次,至今已经举办了15届。IWSLT 2018 吸引了世界各地多所机器翻译领域的知名大学及研究所参加,包括英国爱丁堡大学(University of Edinburgh)、美国约翰霍普金斯大学(JHU)、德国卡尔斯鲁厄理工学院(KIT)、意大利Bruno Kessler 基金会(FBK)、芬兰赫尔辛基大学(Helsinki),以及国内的阿里巴巴、搜狗等。
语音翻译目前主要有两种实现方式,一是传统基线模型(Baseline Model)方案,对输入语音先进行语音识别得到文本结果,然后再进行文本机器翻译,实际应用中由于复杂环境下语音识别错误的存在,导致误差扩散影响最终语音翻译性能;二是采用最新提出的端到端模型(End-to-End Model)方案,基于神经网络强大的建模能力,输入语音直接输出目标译文。本次语音翻译评测任务,主办方对两项技术分别进行了评测。
此外,这也是科大讯飞今年以来在智能语音和人工智能国际权威竞赛或评测项目获得的第九个世界冠军,此前斩获佳绩包括——
2018年10月,在国际自动驾驶领域权威评测任务Cityscapes上,科大讯飞团队刷新了全部两项子任务的世界纪录;
2018年9月,在国际权威英文语音识别大赛“CHiME-5”中,科大讯飞包揽全部四个项目的第一名;
2018年7月,在CGED 2018中文语法错误自动诊断大赛上,科大讯飞综合排名第一;
2018年7月,在国际权威英文语音合成比赛中连续13年蝉联世界第一,仍然是语音合成自然度指标全球唯一超过真人说话水平的公司(获得10个测评项目中的9项第一,在最关键的自然度和相似度评测指标上均大幅领先第二名);
2018年6月,在由模式识别领域国际学术顶会ICPR举办的MTWI(Multi-Type Web Images,多样式网络图像)国际识别挑战赛中,荣膺“文字识别”、“文字检测”和“端到端识别”全部三项冠军;
2018年3月,在由医学影像领域的国际顶级会议ISBI举办的IDRiD糖网病挑战赛上,取得微动脉瘤分割任务第一名、其余三项任务前三名的佳绩;
2018年2月,在由国际计算语言学协会(ACL)下属组织主办的第十二届国际语义评测比赛(SemEval2018)中,斩获基于常识的机器阅读理解全球第一;
2018年1月,机器阅读理解SQuAD阅读理解大赛再次刷新世界纪录,EM得分超过人类平均水平(参赛者包括微软、谷歌、Facebook、IBM、Salesforce、斯坦福大学、卡耐基梅隆大学、清华、北大等国内外企业和科研机构);