语音识别结果处理方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：22566723 阅读：45 留言：0更新日期：2019-11-16 12:45

本发明专利技术公开了语音识别结果处理方法、装置、计算机设备及存储介质，其中方法可包括：获取第一语音识别结果；若确定第一语音识别结果中包含噪音，则对第一语音识别结果进行去噪处理，得到第二语音识别结果；基于第二语音识别结果进行语义解析。应用本发明专利技术所述方案，可提升语义解析的效率及准确性等。

Speech recognition result processing method, device, computer equipment and storage medium

The invention discloses a speech recognition result processing method, a device, a computer device and a storage medium, wherein the method can include: obtaining a first speech recognition result; if it is determined that the first speech recognition result contains noise, the first speech recognition result is denoised to obtain a second speech recognition result; semantic analysis based on the second speech recognition result. Applying the scheme of the invention can improve the efficiency and accuracy of semantic analysis, etc.

全部详细技术资料下载

【技术实现步骤摘要】
语音识别结果处理方法、装置、计算机设备及存储介质
本专利技术涉及计算机应用技术，特别涉及语音识别结果处理方法、装置、计算机设备及存储介质。
技术介绍
语音交互过程中，用户可能会主动产生一些噪音，如“嗯”、“哼”、“啊”、“稍等”、“等一下”等，这些噪音在语音收音及识别的过程中无法避免，但是却会对语义理解产生了很大的干扰，致使很多语音识别结果不能顺利地进行语义解析，从而降低了语义解析效率及语义解析的准确性等。
技术实现思路
有鉴于此，本专利技术提供了语音识别结果处理方法、装置、计算机设备及存储介质。具体技术方案如下：一种语音识别结果处理方法，包括：获取第一语音识别结果；若确定所述第一语音识别结果中包含噪音，则对所述第一语音识别结果进行去噪处理，得到第二语音识别结果；基于所述第二语音识别结果进行语义解析。根据本专利技术一优选实施例，确定所述第一语音识别结果中包含噪音包括：通过将所述第一语音识别结果与预先生成的噪音模板和噪音词典进行匹配，确定出所述第一语音识别结果中是否包含噪音。根据本专利技术一优选实施例，所述通过将所述第一语音识别结果与预先生成的噪音模板和噪音词典进行匹配，确定出所述第一语音识别结果中是否包含噪音包括：确定所述第一语音识别结果的组成结构是否与任一噪音模板相匹配，若是，则根据所述相匹配的噪音模板确定出所述第一语音识别结果中的疑似噪音内容，若所述疑似噪音内容记载在所述噪音词典中，则将所述疑似噪音内容确定为噪...

【技术保护点】
1.一种语音识别结果处理方法，其特征在于，包括：/n获取第一语音识别结果；/n若确定所述第一语音识别结果中包含噪音，则对所述第一语音识别结果进行去噪处理，得到第二语音识别结果；/n基于所述第二语音识别结果进行语义解析。/n

【技术特征摘要】
1.一种语音识别结果处理方法，其特征在于，包括：
获取第一语音识别结果；
若确定所述第一语音识别结果中包含噪音，则对所述第一语音识别结果进行去噪处理，得到第二语音识别结果；
基于所述第二语音识别结果进行语义解析。

2.根据权利要求1所述的方法，其特征在于，
确定所述第一语音识别结果中包含噪音包括：
通过将所述第一语音识别结果与预先生成的噪音模板和噪音词典进行匹配，确定出所述第一语音识别结果中是否包含噪音。

3.根据权利要求2所述的方法，其特征在于，
所述通过将所述第一语音识别结果与预先生成的噪音模板和噪音词典进行匹配，确定出所述第一语音识别结果中是否包含噪音包括：
确定所述第一语音识别结果的组成结构是否与任一噪音模板相匹配，若是，则根据所述相匹配的噪音模板确定出所述第一语音识别结果中的疑似噪音内容，若所述疑似噪音内容记载在所述噪音词典中，则将所述疑似噪音内容确定为噪音。

4.根据权利要求3所述的方法，其特征在于，
所述噪音模板由两类内容组合而成，其中，第一类内容为噪音通配符表示，第二类内容为2-9位数字表示，所述第一类内容和所述第二类内容的数量分别为至少一个；
所述根据所述相匹配的噪音模板确定出所述第一语音识别结果中的疑似噪音内容包括：将所述第一语音识别结果中与所述相匹配的噪音模板中的噪音通配符表示对应的内容作为所述疑似噪音内容。

5.根据权利要求3所述的方法，其特征在于，
该方法进一步包括：标注出所述第一语音识别结果中的噪音；
所述对所述第一语音识别结果进行去噪处理包括：将标注为噪音的内容从所述第一语音识别结果中去除，得到所述第二语音识别结果。

6.根据权利要求4所述的方法，其特征在于，
该方法进一步包括：对所述第一语音识别结果进行预处理；
所述将所述第一语音识别结果与预先生成的噪音模板和噪音词典进行匹配包括：将预处理后的第一语音识别结果与所述噪音模板和噪音词典进行匹配。

7.根据权利要求6所述的方法，其特征在于，
所述对所述第一语音识别结果进行预处理包括：将所述第一语音识别结果中的中文数字表述转换为对应的阿拉伯数字。

8.一种语音识别结果处理装置，其特征在于...

【专利技术属性】
技术研发人员：赵媛媛，刘瑛，付志宏，赖佳伟，邓卓彬，孙珂，李婷婷，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人