一种提高语音识别准确率的方法技术

技术编号:39748703 阅读:45 留言:0更新日期:2023-12-17 23:46
本申请实施例提供了一种提高语音识别准确率的方法

【技术实现步骤摘要】
一种提高语音识别准确率的方法、系统和介质


[0001]本申请涉及智慧语音
,具体而言,涉及一种提高语音识别准确率的方法

系统和介质


技术介绍

[0002]目前语音识别技术的广泛使用涵盖了人机交互的各个领域,语音识别的核心难题在于识别个性化的用户语音表述习惯,并甄辨不同环境干扰下的语音语义,且不同用户的职业

身份

语境

语系的差异造成的语义表述的情绪加持的补偿性干扰对语音识别精准度和效果增加难度,而目前缺少可根据用户表达信息结合个性情态和表达语境以及语音采集环境进行有效补偿和修正,以实现对语音识别响应能力的精准度的有效修正和判断手段,因此,如何获取用户个性化的表述信息以及语义信息,并识别语音环境的干扰影响要素和用户表达情绪要素,对用户语音语义行为的识别判断响应进行结果修正,以提高语音识别响应能力的精准度并进行检验,具有实际的应用意义

[0003]针对上述问题,目前亟待有效的技术解决方案


技术实现思路

[0004]本申请实施例的目的在于提供一种提高语音识别准确率的方法

系统和介质,可以基于语音大数据对语音信息结合场景环境进行数据处理和评估,对语音识别结果进行准确度判断,提高对用户语音识别准确率的校准判断

[0005]本申请实施例还提供了一种提高语音识别准确率的方法,包括以下步骤:采集用户在预设时间段内的语音片段信息,并获取用户属性标记信息以及语音获取环境的语音环境信息;根据所述语音片段信息提取语音片段特征数据,并根据语音片段特征数据处理获得语音频调特性因子和用户情绪修正因子以及语音情绪诱扰因指数;根据所述语音环境信息提取声场环境特征数据以及环境声噪音扰特征数据,并根据声场环境特征数据和环境声噪音扰特征数据分别处理,获得环况净态系数和环状声扰补偿系数;根据所述用户属性标记信息的数据结合所述语音片段特征数据以及所述声场环境特征数据和环境声噪音扰特征数据获得对应预设类型语义拾取识别模型,以及语义行为识别响应阈值;根据所述预设类型语义拾取识别模型对所述语音片段信息进行识别处理,获得多个语音关键表意数据和多个语音表述动作数据,并结合所述语音情绪诱扰因指数进行处理,获得语义行为预判响应数据;根据所述环况净态系数和环状声扰补偿系数对所述语义行为预判响应数据进行修正处理,获得语义行为识别响应修正数据;根据所述语义行为识别响应修正数据与所述语义行为识别响应阈值进行阈值对
比,根据阈值对比结果判断对用户的语音行为识别的准确度

[0006]可选地,在本申请实施例所述的提高语音识别准确率的方法中,所述采集用户在预设时间段内的语音片段信息,并获取用户属性标记信息以及语音获取环境的语音环境信息,包括:采集用户在预设时间段内的语音片段信息,并获取用户属性标记信息;获取所述用户语音所处环境的语音环境信息;根据所述用户属性标记信息提取用户身份属性特征数据和用户母语类别标记数据

[0007]可选地,在本申请实施例所述的提高语音识别准确率的方法中,所述根据所述语音片段信息提取语音片段特征数据,并根据语音片段特征数据处理获得语音频调特性因子和用户情绪修正因子以及语音情绪诱扰因指数,包括:根据所述语音片段信息提取语音片段特征数据,包括音色音频特征数据

音符发音特征数据

播音清晰度特征数据

语态音调波动特征数据以及情态起伏特征数据;根据所述音色音频特征数据

音符发音特征数据

播音清晰度特征数据

语态音调波动特征数据以及情态起伏特征数据通过预设语音情绪诱导干扰识别模型进行处理,分别获得语音频调特性因子和用户情绪修正因子;根据所述语音频调特性因子和用户情绪修正因子处理获得语音情绪诱扰因指数;所述语音情绪诱扰因指数的程序公式为:;;;其中,为语音情绪诱扰因指数,为语音频调特性因子,为用户情绪修正因子,
、、、、
分别为音色音频特征数据

音符发音特征数据

播音清晰度特征数据

语态音调波动特征数据

情态起伏特征数据,为预设类别母语辨识补偿因子,
、、、、、、
为预设特征系数

[0008]可选地,在本申请实施例所述的提高语音识别准确率的方法中,所述根据所述语音环境信息提取声场环境特征数据以及环境声噪音扰特征数据,并根据声场环境特征数据和环境声噪音扰特征数据分别处理,获得环况净态系数和环状声扰补偿系数,包括:根据所述语音环境信息提取声场环境特征数据以及环境声噪音扰特征数据;所述声场环境特征数据包括环境空间指标数据

音散分布指标数据

混响度指标数据以及声音覆盖率数据,所述环境声噪音扰特征数据包括环境嘈杂度指标数据

噪音频色分类数据

音散衰减率数据以及啸音指标数据;根据所述声场环境特征数据处理获得环况净态系数,根据所述环境声噪音扰特征数据处理获得环状声扰补偿系数;所述环况净态系数的计算公式为:
;所述环状声扰补偿系数的计算公式为:;其中,为环况净态系数,为环状声扰补偿系数,
、、、
分别为环境空间指标数据

音散分布指标数据

混响度指标数据

声音覆盖率数据,
、、、
分别为环境嘈杂度指标数据

噪音频色分类数据

音散衰减率数据

啸音指标数据,
、、、、、、、
为预设特征系数

[0009]可选地,在本申请实施例所述的提高语音识别准确率的方法中,所述根据所述用户属性标记信息的数据结合所述语音片段特征数据以及所述声场环境特征数据和环境声噪音扰特征数据获得对应预设类型语义拾取识别模型,以及语义行为识别响应阈值,包括:根据所述用户身份属性特征数据和用户母语类别标记数据结合所述音色音频特征数据和所述混响度指标数据

音散分布指标数据以及所述噪音频色分类数据

音散衰减率数据通过预设类型语义拾取识别模型库获得对应预设类型语义拾取识别模型,以及对应语义行为识别响应阈值

[0010]可选地,在本申请实施例所述的提高语音识别准确率的方法中,所述根据所述预设类型语义拾取识别模型对所述语音片段信息进行识别处理,获得多个语音关键表意数据和多个语音表述动作数据,并结合所述语音情绪诱扰因指数进行处理,获得语义行为预判响应数据,包括:根据所述预设类型语义拾取识别模型对所述语音片段信息进行识别处理,获得多个语音关键表意数据和多个语音表述动作数据;根据多个所述语音关键表意数据以及语音表述动作数据结合所述语音情绪诱扰因指数通过预设类型语义行为检测模型进本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种提高语音识别准确率的方法,其特征在于,包括以下步骤:采集用户在预设时间段内的语音片段信息,并获取用户属性标记信息以及语音获取环境的语音环境信息;根据所述语音片段信息提取语音片段特征数据,并根据语音片段特征数据处理获得语音频调特性因子和用户情绪修正因子以及语音情绪诱扰因指数;根据所述语音环境信息提取声场环境特征数据以及环境声噪音扰特征数据,并根据声场环境特征数据和环境声噪音扰特征数据分别处理,获得环况净态系数和环状声扰补偿系数;根据所述用户属性标记信息的数据结合所述语音片段特征数据以及所述声场环境特征数据和环境声噪音扰特征数据获得对应预设类型语义拾取识别模型,以及语义行为识别响应阈值;根据所述预设类型语义拾取识别模型对所述语音片段信息进行识别处理,获得多个语音关键表意数据和多个语音表述动作数据,并结合所述语音情绪诱扰因指数进行处理,获得语义行为预判响应数据;根据所述环况净态系数和环状声扰补偿系数对所述语义行为预判响应数据进行修正处理,获得语义行为识别响应修正数据;根据所述语义行为识别响应修正数据与所述语义行为识别响应阈值进行阈值对比,根据阈值对比结果判断对用户的语音行为识别的准确度
。2.
根据权利要求1所述的提高语音识别准确率的方法,其特征在于,所述采集用户在预设时间段内的语音片段信息,并获取用户属性标记信息以及语音获取环境的语音环境信息,包括:采集用户在预设时间段内的语音片段信息,并获取用户属性标记信息;获取所述用户语音所处环境的语音环境信息;根据所述用户属性标记信息提取用户身份属性特征数据和用户母语类别标记数据
。3.
根据权利要求2所述的提高语音识别准确率的方法,其特征在于,所述根据所述语音片段信息提取语音片段特征数据,并根据语音片段特征数据处理获得语音频调特性因子和用户情绪修正因子以及语音情绪诱扰因指数,包括:根据所述语音片段信息提取语音片段特征数据,包括音色音频特征数据

音符发音特征数据

播音清晰度特征数据

语态音调波动特征数据以及情态起伏特征数据;根据所述音色音频特征数据

音符发音特征数据

播音清晰度特征数据

语态音调波动特征数据以及情态起伏特征数据通过预设语音情绪诱导干扰识别模型进行处理,分别获得语音频调特性因子和用户情绪修正因子;根据所述语音频调特性因子和用户情绪修正因子处理获得语音情绪诱扰因指数;所述语音情绪诱扰因指数的程序公式为:;;
;其中,为语音情绪诱扰因指数,为语音频调特性因子,为用户情绪修正因子,
、、、、
分别为音色音频特征数据

音符发音特征数据

播音清晰度特征数据

语态音调波动特征数据

情态起伏特征数据,为预设类别母语辨识补偿因子,
、、、、、、
为预设特征系数
。4.
根据权利要求3所述的提高语音识别准确率的方法,其特征在于,所述根据所述语音环境信息提取声场环境特征数据以及环境声噪音扰特征数据,并根据声场环境特征数据和环境声噪音扰特征数据分别处理,获得环况净态系数和环状声扰补偿系数,包括:根据所述语音环境信息提取声场环境特征数据以及环境声噪音扰特征数据;所述声场环境特征数据包括环境空间指标数据

音散分布指标数据

混响度指标数据以及声音覆盖率数据,所述环境声噪音扰特征数据包括环境嘈杂度指标数据

噪音频色分类数据

音散衰减率数据以及啸音指标数据;根据所述声场环境特征数据处理获得环况净态系数,根据所述环境声噪音扰特征数据处理获得环状声扰补偿系数;所述环况净态系数的计算公式为:;所述环状声扰补偿系数的计算公式为:;其中,为环况净态系数,为环状声扰补偿系数,
、、、
分别为环境空间指标数据

音散分布指标数据

混响度指标数据

声音覆盖率数据,
、、、
分别为环境嘈杂度指标数据

噪音频色分类数据

音散衰减率数据<...

【专利技术属性】
技术研发人员:邓从健陈茂强张志青邵德伟汤冬儿江晓锋陈小丰李礼红
申请(专利权)人:广州云趣信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1