一种纠正噪音文本的语音识别方法、系统及存储介质技术方案

技术编号:24614917 阅读:27 留言:0更新日期:2020-06-24 01:53
本发明专利技术涉及一种纠正噪音文本的语音识别方法、系统及存储介质,其中,语音识别方法包括:获取音频信号;对获取的音频信号进行语音识别,得到初始识别文本;对初始识别文本进行分词操作,得到分解后的词组;重组分解后的词组,得到若干重组语句;利用N‑Gram模型,计算各个重组语句的概率值;根据预先构建的业务对话语料库,利用TF‑IDF模型,计算各个重组语句的权重值;根据各个重组语句的概率值以及权重值,计算各个重组语句的加权概率值,选择加权概率值符合预设条件的重组语句,作为结果识别文本。可以对夹杂有其他人声音的噪音文本进行过滤,以得到符合当前对话场景的语音识别结果,提高语音识别的精确性,提升交互效率和体验。

A speech recognition method, system and storage medium for correcting noisy text

【技术实现步骤摘要】
一种纠正噪音文本的语音识别方法、系统及存储介质
本专利技术涉及语音识别
,特别是涉及一种纠正噪音文本的语音识别方法、系统及存储介质。
技术介绍
随着人工智能技术的不断发展,在越来越多的场景中,都采用了人工智能技术,来与用户进行交互,以提供各种各样的服务。其中,语音识别,因为比较贴合人们正常的交流习惯,而在人机交互中占有重要的地位。银行大厅,或者营业厅等场景,属于相对比较嘈杂的环境。在智能机器人与用户进行对话过程中,智能机器人,不仅会获取到用户的语音,还会拾取到大量的环境噪音。这些环境噪音,可能是其他人的对话声音,或者机器声音,或者外部街道的声音。因为这些环境噪音的干扰,语音识别的结果中可能会存在噪音文本,比如夹杂着他人的话语或者无意义的噪音,智能机器人不能有效判断出用户的实际意图,从而影响到智能机器人与用户之间的交互效率和体验。现有技术中,为了降低环境噪音对语音识别的干扰,在提取用于语音识别的特征之前,会对拾取的音频信号进行过滤,比如说,设置音量阈值,过滤掉音量小于音量阈值的音频信号。但是,这些在提取特征之前的过滤操作,会对音频信号进行删减,对后续的语音识别结果的完整性有一定的影响;而且,这种过滤操作,不能有效过滤类似人声的噪音信号,不能有效降低环境噪音对语音识别的干扰。
技术实现思路
基于此,有必要针对现有场景下存在环境噪音,语音识别结果存在噪音,导致智能机器人不能准确判断出用户的意图,影响与用户之间的交互效率和体验的问题,提供一种纠正噪音文本的语音识别方法、系统及存储介质。本申请一实施例提供了一种纠正噪音文本的语音识别方法,包括:获取音频信号;对获取的音频信号进行语音识别,得到初始识别文本;对初始识别文本进行分词操作,得到分解后的词组;重组分解后的词组,得到若干重组语句;利用N-Gram模型,计算各个重组语句的概率值;根据预先构建的业务对话语料库,利用TF-IDF模型,计算各个重组语句的权重值;根据各个重组语句的概率值以及权重值,计算各个重组语句的加权概率值,选择加权概率值符合预设条件的重组语句,作为结果识别文本。在一些实施例中,所述重组分解后的词组,得到若干重组语句的步骤,具体包括:对分解后的词组,进行词性标注;根据分解后的词组的词性,重组得到若干重组语句。在一些实施例中,在所述获取音频信号步骤之后,还包括:判断是否有人,如果判断有人,则对获取的音频信号进行语音识别,得到初始识别文本。在一些实施例中,获取音频信号时,还可以获取声源方位;所述判断是否有人的步骤,具体为:判断所述声源方位是否有人,仅当判断声源方位有人时,对获取的音频信号进行语音识别,得到初始识别文本。在一些实施例中,利用预先训练的语义识别模型,识别结果识别文本的语义,得到语义结果。本申请另一实施例提供了一种纠正噪音文本的语音识别系统,包括:音频获取单元,用于获取音频信号;语音识别单元,用于对获取的音频信号进行语音识别,得到初始识别文本;分词单元,用于对初始识别文本进行分词操作,得到分解后的词组;语句重组单元,用于重组分解后的词组,得到若干重组语句;语句概率计算单元,用于利用N-Gram模型,计算各个重组语句的概率值;权重确定单元,用于根据预先构建的业务对话语料库,利用TF-IDF模型,计算各个重组语句的权重值;结果文本确定单元,用于根据各个重组语句的概率值以及权重值,计算各个重组语句的加权概率值,选择加权概率值符合预设条件的重组语句,作为结果识别文本。在一些实施例中,还包括人员检测单元,用于判断是否有人;如果判断有人,则触发语音识别单元,对获取的音频信号进行语音识别。在一些实施例中,还包括停用词过滤单元,用于对分解后的词组进行去停用词操作。在一些实施例中,还包括语义识别单元,用于利用预先训练的语义识别模型,识别结果识别文本的语义,得到语义结果。本申请另一实施例还提供了一种机器可读存储介质,其上存储有计算机程序,其中所述计算机程序在由处理器执行时实现任一项前述实施例所述的纠正噪音文本的语音识别方法。本申请实施例提供的语音识别方法,在对音频信号进行语音识别的基础上,对初始识别文本进行分词、重组,并利用N-Gram模型和TF-IDF模型,结合业务对话语料库,对重组语句进行是否符合业务逻辑的语义层面分析,从中筛选出符合要求的重组语句,作为最终的识别文本。本申请实施例提供的语音识别方法,可以对夹杂有其他人声音的噪音文本进行过滤,以得到符合当前对话场景的语音识别结果,提高语音识别的精确性,提升智能机器人与用户之间的交互效率和体验。附图说明图1为本申请一实施例的语音识别方法的流程示意图;图2为本申请另一实施例的语音识别方法的流程示意图;图3为本申请一实施例的语音识别系统的架构示意图;图4为本申请另一实施例的语音识别系统的架构示意图。具体实施方式为了能够更清楚地理解本专利技术的上述目的、特征和优点,下面结合附图和具体实施方式对本专利技术进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施方式及实施方式中的特征可以相互组合。除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。本文中在本专利技术的说明书中所使用的术语只是为了描述具体的实施方式的目的,不是旨在于限制本专利技术。如图1所示,本申请一实施例公开了一种纠正噪音文本的语音识别方法,包括:S100,获取音频信号;纠正噪音文本的语音识别方法,可以由一个语音识别系统来执行,并提供一个前端的智能机器人来提供与用户交互的界面。智能机器人上设置有收音设备,可以采集音频信号,然后发送给语音识别系统。智能机器人可以实时采集音频信号,也可以根据触发来采集音频信号。智能机器人与用户进行交互的场景,一般具有大量的环境噪音。为了避免获取到大量无效的音频信号,智能机器人可以获取预设方向的音频信号。具体的,可以使用定向收音设备,比如麦克风阵列,获取预设方向的音频信号,利用空间滤波特性,对预设方向的音频信号进行增强,对其他方向的噪声进行抑制。示例的,定向收音设备,可以具体为六麦克风阵列,在获取音频信号的同时,还可以获取声源方位。智能机器人可以设置有交互方向,比如智能机器人的正前方的一定角度范围,为交互方向。获取音频信号的预设方向,可以与交互方向一致。因为环境噪音的存在,获取的音频信号,可能仅包括环境噪音,而实际上没有用户与智能机器人进行交互。为了避免环境噪音导致的误判,在一些实施例中,如图2所示,在步骤S100之后,还可以包括:S150,判断是否有人,如果判断有人,则进入步骤S200;如果判断没有人,则终止流程,不对获取的音频信号进行语音识别。可以使用激光雷达、红外检测、人脸检测、压力传感等检测方式,来判断是否有人本文档来自技高网
...

【技术保护点】
1.一种纠正噪音文本的语音识别方法,其特征在于,包括:/n获取音频信号;/n对获取的音频信号进行语音识别,得到初始识别文本;/n对初始识别文本进行分词操作,得到分解后的词组;/n重组分解后的词组,得到若干重组语句;/n利用N-Gram模型,计算各个重组语句的概率值;/n根据预先构建的业务对话语料库,利用TF-IDF模型,计算各个重组语句的权重值;/n根据各个重组语句的概率值以及权重值,计算各个重组语句的加权概率值,选择加权概率值符合预设条件的重组语句,作为结果识别文本。/n

【技术特征摘要】
1.一种纠正噪音文本的语音识别方法,其特征在于,包括:
获取音频信号;
对获取的音频信号进行语音识别,得到初始识别文本;
对初始识别文本进行分词操作,得到分解后的词组;
重组分解后的词组,得到若干重组语句;
利用N-Gram模型,计算各个重组语句的概率值;
根据预先构建的业务对话语料库,利用TF-IDF模型,计算各个重组语句的权重值;
根据各个重组语句的概率值以及权重值,计算各个重组语句的加权概率值,选择加权概率值符合预设条件的重组语句,作为结果识别文本。


2.根据权利要求1所述的语音识别方法,其特征在于,所述重组分解后的词组,得到若干重组语句的步骤,具体包括:
对分解后的词组,进行词性标注;
根据分解后的词组的词性,重组得到若干重组语句。


3.根据权利要求1所述的语音识别方法,其特征在于,在所述获取音频信号步骤之后,还包括:
判断是否有人,如果判断有人,则对获取的音频信号进行语音识别,得到初始识别文本。


4.根据权利要求3所述的语音识别方法,其特征在于,获取音频信号时,还可以获取声源方位;
所述判断是否有人的步骤,具体为:
判断所述声源方位是否有人,仅当判断声源方位有人时,对获取的音频信号进行语音识别,得到初始识别文本。


5.根据权利要求1所述的语音识别方法,其特征在于,还包括:
利用预先训练的语义识别模型,识别结果识别文本的...

【专利技术属性】
技术研发人员:陆俊贤黄华周院平孙信中矫人全
申请(专利权)人:南京奥拓电子科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1