【技术实现步骤摘要】
本专利技术涉及语音信号处理
,具体涉及一种语音识别文本处理方法及系统。
技术介绍
随着语音技术的发展,自动语音识别技术已经被广泛地应用于生产、生活的各个领域,构造出各种实用的语音识别系统,如语音会议转写系统等。然而,在实际的识别文本中,经常会存在各种异常语音数据的识别文本,因此不可避免地会产生一些异常识别文本。由于异常语音数据的识别文本可懂度较低,经常会使用户无法理解识别文本所表达的语义,给用户造成干扰,甚至误导用户,如异常语音数据为“九幺零九后边再隔一家”,识别文本为“九幺零九后面的可以去”。因此,如何减轻异常语音识别文本对用户的干扰,是业界需要解决的一个问题。
技术实现思路
本专利技术提供一种语音识别文本处理方法及系统,以自动检测出异常语音数据的识别文本并标记出来,提示用户,降低对用户的误导。为此,本专利技术提供如下技术方案:一种语音识别文本处理方法,包括:获取待识别语音数据;对所述语音数据进行语音识别,得到所述语音数据对应的语音识别结果,所述语音识别结果为语音数据对应的识别文本;对所述语音数据进行异常语音检测,以确定所述语音数据中的异常语音;对所述识别文本中对应所述异常语音的部分进行标记;将标记后的识别文本提供给用户。优选地,所述根据语音识别结果对所述语音数据进行异常语音检测,得到异常语音检测结果包括:依次获取所述语音数据中的待检测语音片段;根据语音识别结果计算所述待检测语音片段的后验概率和/或置信度;基于所述后验概率和/或置信度确定所述待检测语音片段是否为异常语音。优选地,所述根据语音识别结果计算所述待检测语音片段的后验概率包括:根据语音识别时 ...
【技术保护点】
一种语音识别文本处理方法,其特征在于,包括:获取待识别语音数据;对所述语音数据进行语音识别,得到所述语音数据对应的语音识别结果,所述语音识别结果为语音数据对应的识别文本;对所述语音数据进行异常语音检测,以确定所述语音数据中的异常语音;对所述识别文本中对应所述异常语音的部分进行标记;将标记后的识别文本提供给用户。
【技术特征摘要】
1.一种语音识别文本处理方法,其特征在于,包括:获取待识别语音数据;对所述语音数据进行语音识别,得到所述语音数据对应的语音识别结果,所述语音识别结果为语音数据对应的识别文本;对所述语音数据进行异常语音检测,以确定所述语音数据中的异常语音;对所述识别文本中对应所述异常语音的部分进行标记;将标记后的识别文本提供给用户。2.根据权利要求1所述的方法,其特征在于,所述根据语音识别结果对所述语音数据进行异常语音检测,得到异常语音检测结果包括:依次获取所述语音数据中的待检测语音片段;根据语音识别结果计算所述待检测语音片段的后验概率和/或置信度;基于所述后验概率和/或置信度确定所述待检测语音片段是否为异常语音。3.根据权利要求2所述的方法,其特征在于,所述根据语音识别结果计算所述待检测语音片段的后验概率包括:根据语音识别时的解码路径,确定当前待检测语音片段对应的各语法单元;计算各语法单元每帧语音数据的后验概率;将当前待检测语音片段对应的所有语法单元每帧语音数据的后验概率进行融合处理,得到当前待检测语音片段的后验概率;所述根据语音识别结果计算所述待检测语音片段的置信度包括:提取所述待检测语音片段的检测特征,所述检测特征包括:所述待检测语音片段的识别特征;或者所述检测特征包括:待检测语音片段的识别特征、以及所述待检测语音片段对应的识别文本的语义特征;或者所述检测特征包括:待检测语音片段的识别特征、所述待检测语音片段对应的识别文本的语义特征、以及所述待检测语音片段的后验概率;根据所述检测特征计算所述待检测语音数据的置信度;所述基于所述后验概率和/或置信度确定所述待检测语音片段是否为异常语音包括:如果当前待检测语音片段的后验概率和/或置信度小于设定的阈值,则确定当前待检测语音片段为异常语音。4.根据权利要求3所述的方法,其特征在于,所述后验概率包括:状态后验概率、和/或属性后验概率。5.根据权利要求2所述的方法,其特征在于,所述方法还包括:在对所述语音数据进行语音识别之前,依次获取所述语音数据中的待检测语音片段;如果当前待检测语音片段满足设定的异常语音确定规则,则在对所述语音数据进行语音识别后,不再对所述当前待检测语音片段进行异常语音检测,而是直接将所述当前待检测语音片段作为异常语音。6.根据权利要求1至5任一项所述的方法,其特征在于,所述对所述识别文本中对应所述异常语音的部分进行标记包括以下任意一种或多种:对所述异常语音的识别文本添加下划线、或删除线;将所述异常语音的识别文本调整为与其它识别文本不同的颜色和/或字体;将所述异常语音的识别文本调整为渐变色;使用多侯选的方式显示异常语音的识别文本。7.根据权利要求6所述的方法,其特征在于,所述方法还包括:在用户点击有标记的识别文本时,弹出带有提示信息的消息框、或气泡、或包含提示信息的图片。8.根据权利要求7所述的方法,其特征在于,所述方法还包括:将所述提示信息合成语音,并播放所述语音给用户。9.一种语音识别文本处理系统,其特征在于,包括:接收模块,用于获取待识别语音数据...
【专利技术属性】
技术研发人员:占吉清,高建清,刘聪,王智国,胡国平,胡郁,刘庆峰,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。