一种纠正噪音文本的语音识别方法、系统及存储介质技术方案

技术编号：24614917 阅读：27 留言：0更新日期：2020-06-24 01:53

本发明专利技术涉及一种纠正噪音文本的语音识别方法、系统及存储介质，其中，语音识别方法包括：获取音频信号；对获取的音频信号进行语音识别，得到初始识别文本；对初始识别文本进行分词操作，得到分解后的词组；重组分解后的词组，得到若干重组语句；利用N‑Gram模型，计算各个重组语句的概率值；根据预先构建的业务对话语料库，利用TF‑IDF模型，计算各个重组语句的权重值；根据各个重组语句的概率值以及权重值，计算各个重组语句的加权概率值，选择加权概率值符合预设条件的重组语句，作为结果识别文本。可以对夹杂有其他人声音的噪音文本进行过滤，以得到符合当前对话场景的语音识别结果，提高语音识别的精确性，提升交互效率和体验。

A speech recognition method, system and storage medium for correcting noisy text

全部详细技术资料下载

【技术实现步骤摘要】
一种纠正噪音文本的语音识别方法、系统及存储介质
本专利技术涉及语音识别
，特别是涉及一种纠正噪音文本的语音识别方法、系统及存储介质。
技术介绍
随着人工智能技术的不断发展，在越来越多的场景中，都采用了人工智能技术，来与用户进行交互，以提供各种各样的服务。其中，语音识别，因为比较贴合人们正常的交流习惯，而在人机交互中占有重要的地位。银行大厅，或者营业厅等场景，属于相对比较嘈杂的环境。在智能机器人与用户进行对话过程中，智能机器人，不仅会获取到用户的语音，还会拾取到大量的环境噪音。这些环境噪音，可能是其他人的对话声音，或者机器声音，或者外部街道的声音。因为这些环境噪音的干扰，语音识别的结果中可能会存在噪音文本，比如夹杂着他人的话语或者无意义的噪音，智能机器人不能有效判断出用户的实际意图，从而影响到智能机器人与用户之间的交互效率和体验。现有技术中，为了降低环境噪音对语音识别的干扰，在提取用于语音识别的特征之前，会对拾取的音频信号进行过滤，比如说，设置音量阈值，过滤掉音量小于音量阈值的音频信号。但是，这些在提取特征之前的过滤操作，会对音频信号进行删减，对后续的语音识别结果的完整性有一定的影响；而且，这种过滤操作，不能有效过滤类似人声的噪音信号，不能有效降低环境噪音对语音识别的干扰。
技术实现思路
基于此，有必要针对现有场景下存在环境噪音，语音识别结果存在噪音，导致智能机器人不能准确判断出用户的意图，影响与用户之间的交互效率和体验的问题，提供一种纠正噪音文本的语音识别方法、系统及...

【技术保护点】
1.一种纠正噪音文本的语音识别方法，其特征在于，包括：/n获取音频信号；/n对获取的音频信号进行语音识别，得到初始识别文本；/n对初始识别文本进行分词操作，得到分解后的词组；/n重组分解后的词组，得到若干重组语句；/n利用N-Gram模型，计算各个重组语句的概率值；/n根据预先构建的业务对话语料库，利用TF-IDF模型，计算各个重组语句的权重值；/n根据各个重组语句的概率值以及权重值，计算各个重组语句的加权概率值，选择加权概率值符合预设条件的重组语句，作为结果识别文本。/n

【技术特征摘要】
1.一种纠正噪音文本的语音识别方法，其特征在于，包括：
获取音频信号；
对获取的音频信号进行语音识别，得到初始识别文本；
对初始识别文本进行分词操作，得到分解后的词组；
重组分解后的词组，得到若干重组语句；
利用N-Gram模型，计算各个重组语句的概率值；
根据预先构建的业务对话语料库，利用TF-IDF模型，计算各个重组语句的权重值；
根据各个重组语句的概率值以及权重值，计算各个重组语句的加权概率值，选择加权概率值符合预设条件的重组语句，作为结果识别文本。

2.根据权利要求1所述的语音识别方法，其特征在于，所述重组分解后的词组，得到若干重组语句的步骤，具体包括：
对分解后的词组，进行词性标注；
根据分解后的词组的词性，重组得到若干重组语句。

3.根据权利要求1所述的语音识别方法，其特征在于，在所述获取音频信号步骤之后，还包括：
判断是否有人，如果判断有人，则对获取的音频信号进行语音识别，得到初始识别文本。

4.根据权利要求3所述的语音识别方法，其特征在于，获取音频信号时，还可以获取声源方位；
所述判断是否有人的步骤，具体为：
判断所述声源方位是否有人，仅当判断声源方位有人时，对获取的音频信号进行语音识别，得到初始识别文本。

5.根据权利要求1所述的语音识别方法，其特征在于，还包括：
利用预先训练的语义识别模型，识别结果识别文本的...

【专利技术属性】
技术研发人员：陆俊贤，黄华，周院平，孙信中，矫人全，
申请(专利权)人：南京奥拓电子科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人