让机器听懂你的心专利奖巡礼

分享IP智慧传播最IN科技

小赢说:

语音识别技术是人工智能的重要的交互手段,如何让机器既能听懂童言童语,又能听懂各地方言,甚至还能与时俱进地了解网络上的热词呢?现在让我们从去年获得专利奖金奖的科大讯飞的一件语音识别专利说起,看看语音识别技术是怎么实现这么炫酷的魔法的吧?

本文涉及第二十二届中国专利金奖获奖项目

专利号:ZL.9专利名称:语音识别方法及系统

专利权人:安徽科大讯飞信息科技股份有限公司

语音语言是最自然便捷的交流方式,在人工智能的时代语音识别作为一种重要的交互手段,相对于键盘文字输入拥有着直观、方便、简洁的优点,因此成为了人工智能时代一种重要的交互入口。

语音识别最大的难点在于如何识别各种各样、各行各业的不同用户的语音以及如何与时俱进地实现对网络热词的识别。举例来说,小朋友会说童言童语,各个不同地方的人会有不同的方言,不同的行业会有各行业的专业术语,而互联网上也会不断涌现一些新的名词,比如“爷青回、干饭人、集美、后浪、网抑云”等等。这些都给语音识别带来了很大的困难。

科大讯飞这件获得专利金奖的语音识别专利(ZL.9)通过一种简单巧妙的方式解决了语音识别中的上述问题。现有技术中,语音识别是通过构建智能语音识别网络来实现的。识别的过程就像是在网络的迷宫里面寻找一条最佳的路径,这条路径所代表的内容就是语音识别的结果。但是对于不同的用户的方言习惯、语言习惯或者是网络上不断涌现的热词,为了能适应他们的变化,通常需要重新训练语音识别网络的参数,这个过程是非常耗时和浪费资源的。为了解决这个问题,该金奖专利的方案为:对于热词或者用户个性词对应的路径给予奖励。这样在识别过程中会更容易倾向于选择热词或用户个性词对应的路径,从而使得语音识别系统更容易地进行不同用户的语音识别,也更容易识别出信息网络上的热词。专利奖金奖是对科大讯飞这么多年来在语音技术领域深耕研发的认可,同时这件金奖专利也只是科大讯飞语音技术领域专利布局的一个缩影。小赢通过检索发现,近二十年来仅仅在语音识别领域,科大讯飞就提交了数量相当可观的专利申请并取得了授权,构建起了严密高效的专利保护网。这些专利从便利性、准确性、可靠性、个性化等不同的角度,提升了语音识别系统的性能。

现在的手机上一般都会配备语音管家,比如siri等,通常与语音管家交互时都会选择特定的或简短的命令,这时如果采用常规的语音识别方法,就会造成命令识别响应速度低下。ZL.7针对这个问题,先基于受限语法进行语音识别,在受限语法识别不准确时,再采用基于大词汇量连续语音识别网络进行进一步的识别。这就像打仗时先用轻便的小武器,在小武器不足以应对时再上重武器,这样不会出现杀鸡用牛刀的情况,提高了命令识别效率。

在我们语音输入时是不是经常出现识别不准确,需要修改纠错的情况呢?无奈我们输入的句子通常比较长,如果要在手机之类的小显示屏上定位到出错的地方,通常是一件痛苦的事情。ZL.X只需要用户直接输入纠错信息,然后系统会将纠错信息跟之前输入的语音段进行匹配,直接定位到错误位置,从而简单便捷地实现语音输入的纠错。同样为了应对语音识别结果中出现识别错误的情况,ZL.2预先将易错词构建为错词检测模型,并通过该模型实现语音识别结果的修正。同样是进行用户个性化语音识别,尤其是对于用户手机中常见的联系人识别,ZL.7在通过常规的基础静态解码网络进行语音信号解码的同时,还根据每个用户上传的人名信息为每个用户构建了附属静态解码网络,当语音解码的对象是人名时,通过用户附属静态解码网络对任命节点进行网络扩展,避免了常规方式中人名信息输入出现错别字较多的情况。

手机上的语音识别系统通常基于云端服务,但是手机端的网络信号一般不是特别稳定,尤其是在地铁、山区等信号较差的地方,为了不影响语音识别服务的正常使用,ZL.0中在云端和本地端各自维护了一个识别引擎,这样即使没有网络信号,也可以通过本地端识别引擎实现基本的语音识别功能。

在语音输入时,不同的用户说话的快慢与停顿习惯不同,但识别系统中的识别周期是设定好的。为了使用户更适应机器识别的节奏,ZL.9通过对用户语音进行端点检测,识别用户语音停顿状态,并向用户提示识别周期剩余时间,从而使用户可以更好地把控输入的节奏,提高语音录入的质量和语音识别的准确性。目前,科大讯飞语音识别技术,经过产业实践和国际竞技平台的验证,成绩斐然。在国际多通道语音分离和识别大赛CHiME中,科大讯飞三度卫冕。年,科大讯飞还成为北京年冬奥会和冬残奥会官方自动语音转换与翻译独家供应商,致力于打造首个信息沟通无障碍的奥运会。相信有技术研发创新和知识产权保护的双重加持,科大讯飞的发展前景必将更加广阔。

本文作者:

审协北京中心电学部马丽莉本文为作者授权原创首发,文中观点仅代表作者个人观点,未注明图片均来自网络搜索引擎。转载请进入


转载请注明:http://www.tcshunjie.net/syzz/10671.html


当前时间: