语音识别结果处理方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:22566723 阅读:45 留言:0更新日期:2019-11-16 12:45
本发明专利技术公开了语音识别结果处理方法、装置、计算机设备及存储介质,其中方法可包括:获取第一语音识别结果;若确定第一语音识别结果中包含噪音,则对第一语音识别结果进行去噪处理,得到第二语音识别结果;基于第二语音识别结果进行语义解析。应用本发明专利技术所述方案,可提升语义解析的效率及准确性等。

Speech recognition result processing method, device, computer equipment and storage medium

The invention discloses a speech recognition result processing method, a device, a computer device and a storage medium, wherein the method can include: obtaining a first speech recognition result; if it is determined that the first speech recognition result contains noise, the first speech recognition result is denoised to obtain a second speech recognition result; semantic analysis based on the second speech recognition result. Applying the scheme of the invention can improve the efficiency and accuracy of semantic analysis, etc.

【技术实现步骤摘要】
语音识别结果处理方法、装置、计算机设备及存储介质
本专利技术涉及计算机应用技术,特别涉及语音识别结果处理方法、装置、计算机设备及存储介质。
技术介绍
语音交互过程中,用户可能会主动产生一些噪音,如“嗯”、“哼”、“啊”、“稍等”、“等一下”等,这些噪音在语音收音及识别的过程中无法避免,但是却会对语义理解产生了很大的干扰,致使很多语音识别结果不能顺利地进行语义解析,从而降低了语义解析效率及语义解析的准确性等。
技术实现思路
有鉴于此,本专利技术提供了语音识别结果处理方法、装置、计算机设备及存储介质。具体技术方案如下:一种语音识别结果处理方法,包括:获取第一语音识别结果;若确定所述第一语音识别结果中包含噪音,则对所述第一语音识别结果进行去噪处理,得到第二语音识别结果;基于所述第二语音识别结果进行语义解析。根据本专利技术一优选实施例,确定所述第一语音识别结果中包含噪音包括:通过将所述第一语音识别结果与预先生成的噪音模板和噪音词典进行匹配,确定出所述第一语音识别结果中是否包含噪音。根据本专利技术一优选实施例,所述通过将所述第一语音识别结果与预先生成的噪音模板和噪音词典进行匹配,确定出所述第一语音识别结果中是否包含噪音包括:确定所述第一语音识别结果的组成结构是否与任一噪音模板相匹配,若是,则根据所述相匹配的噪音模板确定出所述第一语音识别结果中的疑似噪音内容,若所述疑似噪音内容记载在所述噪音词典中,则将所述疑似噪音内容确定为噪音。根据本专利技术一优选实施例,所述噪音模板由两类内容组合而成,其中,第一类内容为噪音通配符表示,第二类内容为2-9位数字表示,所述第一类内容和所述第二类内容的数量分别为至少一个;所述根据所述相匹配的噪音模板确定出所述第一语音识别结果中的疑似噪音内容包括:将所述第一语音识别结果中与所述相匹配的噪音模板中的噪音通配符表示对应的内容作为所述疑似噪音内容。根据本专利技术一优选实施例,该方法进一步包括:标注出所述第一语音识别结果中的噪音;所述对所述第一语音识别结果进行去噪处理包括:将标注为噪音的内容从所述第一语音识别结果中去除,得到所述第二语音识别结果。根据本专利技术一优选实施例,该方法进一步包括:对所述第一语音识别结果进行预处理;所述将所述第一语音识别结果与预先生成的噪音模板和噪音词典进行匹配包括:将预处理后的第一语音识别结果与所述噪音模板和噪音词典进行匹配。根据本专利技术一优选实施例,所述对所述第一语音识别结果进行预处理包括:将所述第一语音识别结果中的中文数字表述转换为对应的阿拉伯数字。一种语音识别结果处理装置,包括:获取单元、去噪单元以及解析单元;所述获取单元,用于获取第一语音识别结果;所述去噪单元,用于当确定所述第一语音识别结果中包含噪音时,对所述第一语音识别结果进行去噪处理,得到第二语音识别结果;所述解析单元,用于基于所述第二语音识别结果进行语义解析。根据本专利技术一优选实施例,所述去噪单元通过将所述第一语音识别结果与预先生成的噪音模板和噪音词典进行匹配,确定出所述第一语音识别结果中是否包含噪音。根据本专利技术一优选实施例,所述去噪单元确定所述第一语音识别结果的组成结构是否与任一噪音模板相匹配,若是,则根据所述相匹配的噪音模板确定出所述第一语音识别结果中的疑似噪音内容,若所述疑似噪音内容记载在所述噪音词典中,则将所述疑似噪音内容确定为噪音。根据本专利技术一优选实施例,所述噪音模板由两类内容组合而成,其中,第一类内容为噪音通配符表示,第二类内容为2-9位数字表示,所述第一类内容和所述第二类内容的数量分别为至少一个;所述去噪单元将所述第一语音识别结果中与所述相匹配的噪音模板中的噪音通配符表示对应的内容作为所述疑似噪音内容。根据本专利技术一优选实施例,所述去噪单元进一步用于,标注出所述第一语音识别结果中的噪音,将标注为噪音的内容从所述第一语音识别结果中去除,得到所述第二语音识别结果。根据本专利技术一优选实施例,所述去噪单元进一步用于,对所述第一语音识别结果进行预处理,将预处理后的第一语音识别结果与所述噪音模板和噪音词典进行匹配。根据本专利技术一优选实施例,所述去噪单元将所述第一语音识别结果中的中文数字表述转换为对应的阿拉伯数字,实现所述预处理。一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如以上所述的方法。一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如以上所述的方法。基于上述介绍可以看出,采用本专利技术所述方案,可在语音识别之后,语义解析之前,增加一个去噪机制,即去除语音识别结果中包含的噪音,从而提升了语义解析的效率及准确性等。【附图说明】图1为本专利技术所述语音识别结果处理方法第一实施例的流程图。图2为本专利技术所述语音识别结果处理方法第二实施例的流程图。图3为本专利技术所述语音识别结果处理装置实施例的组成结构示意图。图4示出了适于用来实现本专利技术实施方式的示例性计算机系统/服务器12的框图。【具体实施方式】为了使本专利技术的技术方案更加清楚、明白,以下参照附图并举实施例,对本专利技术所述方案进行进一步说明。显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。另外,应理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。图1为本专利技术所述语音识别结果处理方法第一实施例的流程图。如图1所示,包括以下具体实现方式。在101中,获取第一语音识别结果。在102中,若确定第一语音识别结果中包含噪音,则对第一语音识别结果进行去噪处理,得到第二语音识别结果。在103中,基于第二语音识别结果进行语义解析。语音交互过程中,可对用户每次输入的语音进行语音识别,从而可得到文本形式的语音识别结果,为与后续所述的去噪后的语音识别结果进行区分,可将语音识别得到的语音识别结果称为第一语音识别结果。对于第一语音识别结果,可确定其中是否包含噪音,若是,可对第一语音识别结果进行去噪处理,从而得到第二语音识别结果,进而可基于第二语音识别结果进行语义解析,若否,可直接基于第一语音识别结果进行语义解析。优选地,可通过将第一语音识别结果与预先生成的噪音模板和噪音词典进行匹配,确定出第一语音识别结果中是否包含噪音。具体地,可确定第一语音识别结果的组成结构是否与任一噪音模板相匹配,若是,可根据相匹配的噪音模板确定出第一语音识别结果中的疑似噪音内容,若疑似噪音内容记载在噪本文档来自技高网...

【技术保护点】
1.一种语音识别结果处理方法,其特征在于,包括:/n获取第一语音识别结果;/n若确定所述第一语音识别结果中包含噪音,则对所述第一语音识别结果进行去噪处理,得到第二语音识别结果;/n基于所述第二语音识别结果进行语义解析。/n

【技术特征摘要】
1.一种语音识别结果处理方法,其特征在于,包括:
获取第一语音识别结果;
若确定所述第一语音识别结果中包含噪音,则对所述第一语音识别结果进行去噪处理,得到第二语音识别结果;
基于所述第二语音识别结果进行语义解析。


2.根据权利要求1所述的方法,其特征在于,
确定所述第一语音识别结果中包含噪音包括:
通过将所述第一语音识别结果与预先生成的噪音模板和噪音词典进行匹配,确定出所述第一语音识别结果中是否包含噪音。


3.根据权利要求2所述的方法,其特征在于,
所述通过将所述第一语音识别结果与预先生成的噪音模板和噪音词典进行匹配,确定出所述第一语音识别结果中是否包含噪音包括:
确定所述第一语音识别结果的组成结构是否与任一噪音模板相匹配,若是,则根据所述相匹配的噪音模板确定出所述第一语音识别结果中的疑似噪音内容,若所述疑似噪音内容记载在所述噪音词典中,则将所述疑似噪音内容确定为噪音。


4.根据权利要求3所述的方法,其特征在于,
所述噪音模板由两类内容组合而成,其中,第一类内容为噪音通配符表示,第二类内容为2-9位数字表示,所述第一类内容和所述第二类内容的数量分别为至少一个;
所述根据所述相匹配的噪音模板确定出所述第一语音识别结果中的疑似噪音内容包括:将所述第一语音识别结果中与所述相匹配的噪音模板中的噪音通配符表示对应的内容作为所述疑似噪音内容。


5.根据权利要求3所述的方法,其特征在于,
该方法进一步包括:标注出所述第一语音识别结果中的噪音;
所述对所述第一语音识别结果进行去噪处理包括:将标注为噪音的内容从所述第一语音识别结果中去除,得到所述第二语音识别结果。


6.根据权利要求4所述的方法,其特征在于,
该方法进一步包括:对所述第一语音识别结果进行预处理;
所述将所述第一语音识别结果与预先生成的噪音模板和噪音词典进行匹配包括:将预处理后的第一语音识别结果与所述噪音模板和噪音词典进行匹配。


7.根据权利要求6所述的方法,其特征在于,
所述对所述第一语音识别结果进行预处理包括:将所述第一语音识别结果中的中文数字表述转换为对应的阿拉伯数字。


8.一种语音识别结果处理装置,其特征在于...

【专利技术属性】
技术研发人员:赵媛媛刘瑛付志宏赖佳伟邓卓彬孙珂李婷婷
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1