语音识别文本处理方法及系统技术方案

技术编号:14509623 阅读:115 留言:0更新日期:2017-02-01 02:12
本发明专利技术公开了一种语音识别文本处理方法及系统,该方法包括:获取待识别语音数据;对所述语音数据进行语音识别,得到所述语音数据对应的语音识别结果,所述语音识别结果为语音数据对应的识别文本;对所述语音数据进行异常语音检测,以确定所述语音数据中的异常语音;对所述识别文本中对应所述异常语音的部分进行标记;将标记后的识别文本提供给用户。利用本发明专利技术,可以自动检测出异常语音数据的识别文本并标记出来,提示用户,降低对用户的误导。

【技术实现步骤摘要】

本专利技术涉及语音信号处理
,具体涉及一种语音识别文本处理方法及系统
技术介绍
随着语音技术的发展,自动语音识别技术已经被广泛地应用于生产、生活的各个领域,构造出各种实用的语音识别系统,如语音会议转写系统等。然而,在实际的识别文本中,经常会存在各种异常语音数据的识别文本,因此不可避免地会产生一些异常识别文本。由于异常语音数据的识别文本可懂度较低,经常会使用户无法理解识别文本所表达的语义,给用户造成干扰,甚至误导用户,如异常语音数据为“九幺零九后边再隔一家”,识别文本为“九幺零九后面的可以去”。因此,如何减轻异常语音识别文本对用户的干扰,是业界需要解决的一个问题。
技术实现思路
本专利技术提供一种语音识别文本处理方法及系统,以自动检测出异常语音数据的识别文本并标记出来,提示用户,降低对用户的误导。为此,本专利技术提供如下技术方案:一种语音识别文本处理方法,包括:获取待识别语音数据;对所述语音数据进行语音识别,得到所述语音数据对应的语音识别结果,所述语音识别结果为语音数据对应的识别文本;对所述语音数据进行异常语音检测,以确定所述语音数据中的异常语音;对所述识别文本中对应所述异常语音的部分进行标记;将标记后的识别文本提供给用户。优选地,所述根据语音识别结果对所述语音数据进行异常语音检测,得到异常语音检测结果包括:依次获取所述语音数据中的待检测语音片段;根据语音识别结果计算所述待检测语音片段的后验概率和/或置信度;基于所述后验概率和/或置信度确定所述待检测语音片段是否为异常语音。优选地,所述根据语音识别结果计算所述待检测语音片段的后验概率包括:根据语音识别时的解码路径,确定当前待检测语音片段对应的各语法单元;计算各语法单元每帧语音数据的后验概率;将当前待检测语音片段对应的所有语法单元每帧语音数据的后验概率进行融合处理,得到当前待检测语音片段的后验概率;所述根据语音识别结果计算所述待检测语音片段的置信度包括:提取所述待检测语音片段的检测特征,所述检测特征包括:所述待检测语音片段的识别特征;或者所述检测特征包括:待检测语音片段的识别特征、以及所述待检测语音片段对应的识别文本的语义特征;或者所述检测特征包括:待检测语音片段的识别特征、所述待检测语音片段对应的识别文本的语义特征、以及所述待检测语音片段的后验概率;根据所述检测特征计算所述待检测语音数据的置信度;所述基于所述后验概率和/或置信度确定所述待检测语音片段是否为异常语音包括:如果当前待检测语音片段的后验概率和/或置信度小于设定的阈值,则确定当前待检测语音片段为异常语音。优选地,所述后验概率包括:状态后验概率、和/或属性后验概率。优选地,所述方法还包括:在对所述语音数据进行语音识别之前,依次获取所述语音数据中的待检测语音片段;如果当前待检测语音片段满足设定的异常语音确定规则,则在对所述语音数据进行语音识别后,不再对所述当前待检测语音片段进行异常语音检测,而是直接将所述当前待检测语音片段作为异常语音。优选地,所述对所述识别文本中对应所述异常语音的部分进行标记包括以下任意一种或多种:对所述异常语音的识别文本添加下划线、或删除线;将所述异常语音的识别文本调整为与其它识别文本不同的颜色和/或字体;将所述异常语音的识别文本调整为渐变色;使用多侯选的方式显示异常语音的识别文本。优选地,所述方法还包括:在用户点击有标记的识别文本时,弹出带有提示信息的消息框、或气泡、或包含提示信息的图片。优选地,所述方法还包括:将所述提示信息合成语音,并播放所述语音给用户。一种语音识别文本处理系统,包括:接收模块,用于获取待识别语音数据;语音识别模块,用于对所述语音数据进行语音识别,得到所述语音数据对应的语音识别结果,所述语音识别结果为语音数据对应的识别文本;异常语音检测模块,用于对所述语音数据进行异常语音检测,以确定所述语音数据中的异常语音;标记模块,用于对所述识别文本中对应所述异常语音的部分进行标记;文本提供模块,用于将标记后的识别文本提供给用户。优选地,所述异常语音检测模块包括:语音片段提取单元、判断单元、以及后验概率计算单元和/或置信度计算单元;所述语音片段提取单元,用于依次获取所述语音数据中的待检测语音片段;所述后验概率计算单元,用于根据语音识别结果计算所述待检测语音片段的后验概率;所述置信度计算单元,用于根据语音识别结果计算所述待检测语音片段的置信度;所述判断单元,用于基于所述后验概率和/或置信度确定所述待检测语音片段是否为异常语音。优选地,所述后验概率计算单元包括:语法单元确定子单元,用于根据语音识别时的解码路径,确定当前待检测语音片段对应的各语法单元;第一计算子单元,用于计算各语法单元每帧语音数据的后验概率;第一融合单元,用于将当前待检测语音片段对应的所有语法单元每帧语音数据的后验概率进行融合处理,得到当前待检测语音片段的后验概率;所述置信度计算单元包括:特征提取子单元,用于提取所述待检测语音片段的检测特征,所述检测特征包括:所述待检测语音片段的识别特征;或者所述检测特征包括:待检测语音片段的识别特征、以及所述待检测语音片段对应的识别文本的语义特征;或者所述检测特征包括:待检测语音片段的识别特征、所述待检测语音片段对应的识别文本的语义特征、以及所述待检测语音片段的后验概率;第二计算子单元,用于根据所述检测特征计算所述待检测语音数据的置信度;所述判断单元,具体用于在当前待检测语音片段的后验概率和/或置信度小于设定的阈值时,确定当前待检测语音片段为异常语音。优选地,所述系统还包括:预检测模块,用于在所述语音识别模块对所述语音数据进行语音识别之前,依次获取所述语音数据中的待检测语音片段,并且在当前待检测语音片段满足设定的异常语音确定规则时,将所述当前待检测语音片段作为异常语音。优选地,所述标记模块,具体用于采用以下任意一种或多种方式对所述识别文本中对应所述异常语音的部分进行标记:对所述异常语音的识别文本添加下划线、或删除线;将所述异常语音的识别文本调整为与其它识别文本不同的颜色和/或字体;将所述异常语音的识别文本调整为渐变色;使用多侯选的方式显示异常语音的识别文本。优选地,所述系统还包括:提示模块,用于在用户点击有标记的识别文本时,弹出带有提示信息的消息框、或气泡、或包含提示信息的图片。优选地,所述系统还包括:合成模块,用于将所述提示信息合成语音;播放模块,用于播放所述语音给用户。本专利技术实施例提供的语音识别文本处理方法及系统,根据语音识别结果自动对语音数据进行异常语音检测,检测出语音数据中的异常语音,然后对得到的识别文本中对应异常语音的部分进行标记,将标记后的识别文本提供给用户,从而可以达到提示用户的作用,降低异常识别文本对用户的误导。由于异常语音的检测及异常语音的识别文本标记均由系统自动完成,因此,在处理的数据量较大时,可以明显提高效率及准确度。进一步地,本专利技术提供了多种异常语音检测及文本标记方式,相应地,系统采用模块化的设计,在实际应用中可以根据应用环境及需要,灵活、方便地进行选用。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术中记载的一些实施例,对于本本文档来自技高网...

【技术保护点】
一种语音识别文本处理方法,其特征在于,包括:获取待识别语音数据;对所述语音数据进行语音识别,得到所述语音数据对应的语音识别结果,所述语音识别结果为语音数据对应的识别文本;对所述语音数据进行异常语音检测,以确定所述语音数据中的异常语音;对所述识别文本中对应所述异常语音的部分进行标记;将标记后的识别文本提供给用户。

【技术特征摘要】
1.一种语音识别文本处理方法,其特征在于,包括:获取待识别语音数据;对所述语音数据进行语音识别,得到所述语音数据对应的语音识别结果,所述语音识别结果为语音数据对应的识别文本;对所述语音数据进行异常语音检测,以确定所述语音数据中的异常语音;对所述识别文本中对应所述异常语音的部分进行标记;将标记后的识别文本提供给用户。2.根据权利要求1所述的方法,其特征在于,所述根据语音识别结果对所述语音数据进行异常语音检测,得到异常语音检测结果包括:依次获取所述语音数据中的待检测语音片段;根据语音识别结果计算所述待检测语音片段的后验概率和/或置信度;基于所述后验概率和/或置信度确定所述待检测语音片段是否为异常语音。3.根据权利要求2所述的方法,其特征在于,所述根据语音识别结果计算所述待检测语音片段的后验概率包括:根据语音识别时的解码路径,确定当前待检测语音片段对应的各语法单元;计算各语法单元每帧语音数据的后验概率;将当前待检测语音片段对应的所有语法单元每帧语音数据的后验概率进行融合处理,得到当前待检测语音片段的后验概率;所述根据语音识别结果计算所述待检测语音片段的置信度包括:提取所述待检测语音片段的检测特征,所述检测特征包括:所述待检测语音片段的识别特征;或者所述检测特征包括:待检测语音片段的识别特征、以及所述待检测语音片段对应的识别文本的语义特征;或者所述检测特征包括:待检测语音片段的识别特征、所述待检测语音片段对应的识别文本的语义特征、以及所述待检测语音片段的后验概率;根据所述检测特征计算所述待检测语音数据的置信度;所述基于所述后验概率和/或置信度确定所述待检测语音片段是否为异常语音包括:如果当前待检测语音片段的后验概率和/或置信度小于设定的阈值,则确定当前待检测语音片段为异常语音。4.根据权利要求3所述的方法,其特征在于,所述后验概率包括:状态后验概率、和/或属性后验概率。5.根据权利要求2所述的方法,其特征在于,所述方法还包括:在对所述语音数据进行语音识别之前,依次获取所述语音数据中的待检测语音片段;如果当前待检测语音片段满足设定的异常语音确定规则,则在对所述语音数据进行语音识别后,不再对所述当前待检测语音片段进行异常语音检测,而是直接将所述当前待检测语音片段作为异常语音。6.根据权利要求1至5任一项所述的方法,其特征在于,所述对所述识别文本中对应所述异常语音的部分进行标记包括以下任意一种或多种:对所述异常语音的识别文本添加下划线、或删除线;将所述异常语音的识别文本调整为与其它识别文本不同的颜色和/或字体;将所述异常语音的识别文本调整为渐变色;使用多侯选的方式显示异常语音的识别文本。7.根据权利要求6所述的方法,其特征在于,所述方法还包括:在用户点击有标记的识别文本时,弹出带有提示信息的消息框、或气泡、或包含提示信息的图片。8.根据权利要求7所述的方法,其特征在于,所述方法还包括:将所述提示信息合成语音,并播放所述语音给用户。9.一种语音识别文本处理系统,其特征在于,包括:接收模块,用于获取待识别语音数据...

【专利技术属性】
技术研发人员:占吉清高建清刘聪王智国胡国平胡郁刘庆峰
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1