一种语音置信度计算方法、系统、电子设备及介质技术方案

技术编号:35681578 阅读:15 留言:0更新日期:2022-11-23 14:24
本发明专利技术涉及一种语音置信度计算方法、系统、电子设备及介质,包括步骤:获取待处理语音;根据待处理语音,通过编码器,确定输出特征,输出特征表征了编码器提取出的语音的音频特征;根据输出特征,通过声学解码器,确定待处理语音对应的多个目标转译文本,以及每个目标转译文本对应的目标声学得分;根据输出特征和各个目标转译文本,通过语言解码器,确定每个目标转译文本对应的语言得分;根据输出特征、各个目标声学得分和各个语言得分,通过语音置信度模型,确定待处理语音的置信度。现有技术只利用了解码器输出的N个最优得分即判断出语音识别的置信度,缺少了更为丰富的声学编码和语言信息的问题。语言信息的问题。语言信息的问题。

【技术实现步骤摘要】
一种语音置信度计算方法、系统、电子设备及介质


[0001]本专利技术涉及语音识别
,尤其涉及一种语音置信度计算方法、系统、电子设备及介质。

技术介绍

[0002]ASR(Automatic Speech Recognition,自动语音识别)是一种将人的语音转换为可编辑文本的技术,广泛应用于:人机对话、会议记录、实时翻译等场景,随着人工智能技术的发展,以端到端为基础的语音识别技术逐渐成为目前的主流框架,但在该框架下,针对自然嘈杂场景下的语音、未知方言、未知外语等语音,仍然会出现错误转译结果,因此,需要计算语音的置信度来获取语音转换为可编辑文本的准确性。
[0003]目前主流的语音置信度计算方法是采用基于字密度置信度去计算,这种方法的缺点在于只利用了解码器输出的N个最优得分(AM Nbest score) 即判断出语音识别的置信度,缺少了更为丰富的信息,使得确定的置信度不够准确。

技术实现思路

[0004]为了克服现有技术只利用了解码器输出的N个最优得分即判断出语音识别的置信度,缺少了更为丰富的声学编码和语言信息的问题,本专利技术提供了一种语音置信度计算方法、系统、电子设备及介质。
[0005]第一方面,为了解决上述技术问题,本专利技术提供了一种语音置信度计算方法,包括以下步骤:
[0006]获取待处理语音;
[0007]根据待处理语音,通过编码器,确定输出特征,输出特征表征了编码器提取出的语音的音频特征;
[0008]根据输出特征,通过声学解码器,确定待处理语音对应的多个目标转译文本,以及每个目标转译文本对应的目标声学得分,对于每个目标声学得分,目标声学得分表征了待处理语音转译为目标转译文本的概率;
[0009]根据输出特征和各个目标转译文本,通过语言解码器,确定每个目标转译文本对应的语言得分,对于每个语言得分,语言得分表征了目标转译文本对应的权重;
[0010]根据输出特征、各个目标声学得分和各个语言得分,通过语音置信度模型,确定待处理语音的置信度。
[0011]本专利技术提供的一种语音置信度计算方法的有益效果是:通过编码器得到输出特征,通过声学解码器得到目标转译文本的目标声学得分,以及语言解码器得到目标转译文本的语言得分,通过输出特征、目标声学得分和语言得分得到待处理语言的置信度,解决了现有技术只利用了解码器输出的N个最优得分即判断出语音识别的置信度,缺少了更为丰富信息,使得确定的置信度不够准确的问题。
[0012]在上述技术方案的基础上,本专利技术的一种语音置信度计算方法还可以做如下改
进。
[0013]进一步,上述根据输出特征,通过声学解码器,确定语音对应的多个目标转译文本,以及每个目标转译文本对应的目标声学得分,包括:
[0014]根据输出特征,通过声学解码器,确定语音对应的多个第一转译文本,以及每个第一转译文本对应的第一声学得分;
[0015]获取各个第一声学得分中前N个第一声学得分作为目标声学得分,并将各个目标声学得分所对应的第一转译文本作为对应的目标转译文本。
[0016]采用上述进一步方案的有益效果是:输出特征通过声学解码器后,会得到多个第一转译文本,以及每个第一转译文本对应的第一声学得分,由于第一声学得分越大,表明待处理语音转译为该第一声学得分对应的第一转译文本的概率越大,因此,仅获取前N个第一声学得分作为目标声学得分,并将目标声学得分所对应的第一转译文本作为对应的目标转译文本。
[0017]进一步,上述根据输出特征、各个目标声学得分和各个语言得分,通过语音置信度模型,确定语音的置信度,包括:
[0018]根据各个目标声学得分,得到第一向量,第一向量中每个元素表征了任一目标声学得分;
[0019]根据各个语言得分,得到第二向量,第二向量中每个元素表征了任一语言得分;
[0020]根据输出特征,得到第三向量,第三向量中每个元素表征了输出特征中的任一特征;
[0021]根据第一向量、第二向量和第三向量,将第一向量、第二向量和第三向量进行特征串联,得到输入向量;
[0022]根据输入向量,通过语音置信度模型,确定待处理语音的置信度。
[0023]采用上述进一步方案的有益效果是:将输出特征、各个目标声学得分和各个语言得分均转换为向量(即第一向量、第二向量和第三向量),通过第一向量、第二向量和第三向量之间的特征串联,得到输入向量,将输入向量输入语音置信模型,就能得到待处理语音的置信度,由于输入向量融合了输出特征、各个目标声学得分和各个语言得分,因此,丰富了其声学编码和语言信息,使得获取的待处理语音的置信度更准确。
[0024]进一步,该方法还包括:
[0025]根据置信度,确定置信度对应的目标分数,目标分数为0

1的概率值。
[0026]采用上述进一步方案的有益效果是:用户能够直接通过目标分数的大小判断待处理语音的置信度的得分情况,更加直观。
[0027]进一步,上述根据置信度,确定置信度对应的目标分数,包括:
[0028]根据置信度,通过第一公式,确定目标分数,其中,第一公式为:
[0029][0030]其中,f(x)表示目标得分,x表示置信度。
[0031]采用上述进一步方案的有益效果是:将置信度直接输入第一公式中,将置信度通过第一公式映射到范围为0

1的概率上,使得用户能够更加直观的观察待处理语音识别的置信度的得分情况。
[0032]第二方面,本专利技术提供了一种语音置信度计算系统,包括:
[0033]获取模块,用于获取待处理语音;
[0034]第一确定模块,用于根据待处理语音,通过编码器,确定输出特征,输出特征表征了编码器提取出的语音的音频特征;
[0035]第二确定模块,用于通过声学解码器,确定待处理语音对应的多个目标转译文本,以及每个目标转译文本对应的目标声学得分,对于每个目标声学得分,目标声学得分表征了待处理语音转译为目标转译文本的概率;
[0036]第三确定模块,用于根据输出特征和各个目标转译文本,通过语言解码器,确定每个目标转译文本对应的语言得分,对于每个语言得分,语言得分表征了目标转译文本对应的权重;
[0037]第四确定模块,用于根据输出特征、各个目标声学得分和各个语言得分,通过语音置信度模型,确定待处理语音的置信度。
[0038]本专利技术提供的一种语音置信度计算系统的有益效果是:通过编码器得到输出特征,弥补了现有技术缺少的的语言信息,通过声学解码器得到目标转译文本的目标声学得分,以及语言解码器得到目标转译文本的语言得分,弥补了现有技术缺少的的声学编码信息,最后通过输出特征、目标声学得分和语言得分得到待处理语言的置信度,解决了现有技术只利用了解码器输出的N个最优得分即判断出待处理语音的置信度,缺少了更为丰富的声学编码和语言信息的问题。
[0039]第三方面,本专利技术还提供了一种电子设备,包括存储器、处本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音置信度计算方法,其特征在于,包括以下步骤:获取待处理语音;根据所述待处理语音,通过编码器,确定输出特征,所述输出特征表征了所述编码器提取出的所述语音的音频特征;根据所述输出特征,通过声学解码器,确定所述待处理语音对应的多个目标转译文本,以及每个所述目标转译文本对应的目标声学得分,对于每个所述目标声学得分,所述目标声学得分表征了所述待处理语音转译为所述目标转译文本的概率;根据所述输出特征和各个所述目标转译文本,通过语言解码器,确定每个所述目标转译文本对应的语言得分,对于每个所述语言得分,所述语言得分表征了所述目标转译文本对应的权重;根据所述输出特征、各个所述目标声学得分和各个所述语言得分,通过语音置信度模型,确定所述待处理语音的置信度。2.根据权利要求1所述的方法,其特征在于,所述根据所述输出特征,通过声学解码器,确定所述语音对应的多个目标转译文本,以及每个所述目标转译文本对应的目标声学得分,包括:根据所述输出特征,通过声学解码器,确定所述待处理语音对应的多个第一转译文本,以及每个所述第一转译文本对应的第一声学得分;获取各个所述第一声学得分中前N个第一声学得分作为目标声学得分,并将各个所述目标声学得分所对应的第一转译文本作为对应的目标转译文本。3.根据权利要求1所述的方法,其特征在于,所述根据所述输出特征、各个所述目标声学得分和各个所述语言得分,通过语音置信度模型,确定所述语音的置信度,包括:根据各个所述目标声学得分,得到第一向量,所述第一向量中每个元素表征了任一目标声学得分;根据各个所述语言得分,得到第二向量,所述第二向量中每个元素表征了任一语言得分;根据输出特征,得到第三向量,所述第三向量中每个元素表征了输出特征中的任一特征;根据所述第一向量、第二向量和第三向量,将所述第一向量、第二向量和第三向量进行特征串联...

【专利技术属性】
技术研发人员:杨恒杰
申请(专利权)人:数美天下北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1