领域自适应语音识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：37978498 阅读：6 留言：0更新日期：2023-06-30 09:53

本发明专利技术公开了一种领域自适应语音识别方法、装置、计算机设备及存储介质，该方法包括：获取待识别语音数据；对所述待识别语音数据进行一次解码，获取多个候选识别结果，从多个候选识别结果中获取最优识别结果；根据所述最优识别结果进行领域判断，确定目标领域；采用所述目标领域对应的目标语言模型，对多个所述候选识别结果进行二次解码，获取目标识别结果。该方法采用目标领域对应的目标语言模型对多个候选识别结果进行二次解码，可适应用户多变的说话领域，提升多领域和跨领域识别时的准确性，提升语音识别的鲁棒性，提供更好的用户体验。验。验。

全部详细技术资料下载

【技术实现步骤摘要】
领域自适应语音识别方法、装置、计算机设备及存储介质

[0001]本专利技术涉及语音识别
，尤其涉及一种领域自适应语音识别方法、装置、计算机设备及存储介质。

技术介绍

[0002]语音识别技术已经广泛应用在很多场景中，并且取得了不错的效果。但是，由于人类语言和语音信号本身的复杂性，依赖目前的模型性能，语音识别系统无法保证在任何场景中都取得很好的识别精度。现有的语音识别模型一般针对特征领域的语音识别结果较准确，如果要兼顾多个领域，甚至不限定语音领域时，其语音识别准确性就会大幅度下降。例如，金融领域的语音识别系统对涉及到金融领域的语音，有很高的识别准确性，但对音乐、游戏或者其他领域的语音，语音识别准确性就会大幅下降。而在实际应用场景中，用户说话的内容所属领域往往是非常广泛的，用户在不同的时刻会说不同领域的内容，普通的语音识别系统难以应对用户这种复杂的使用需求，影响用户体验。

技术实现思路

[0003]本专利技术实施例提供一种领域自适应语音识别方法、装置、计算机设备及存储介质，以解决多领域或跨领域语音识别准确性的问题。
[0004]一种领域自适应语音识别方法，包括：
[0005]获取待识别语音数据；
[0006]对所述待识别语音数据进行一次解码，获取多个候选识别结果，从多个所述候选识别结果中获取最优识别结果；
[0007]根据所述最优识别结果进行领域判断，确定目标领域；
[0008]采用所述目标领域对应的目标语言模型，对多个所述候选识别结果进行二次解码，获取目标识...

【技术保护点】

【技术特征摘要】
1.一种领域自适应语音识别方法，其特征在于，包括：获取待识别语音数据；对所述待识别语音数据进行一次解码，获取多个候选识别结果，从多个所述候选识别结果中获取最优识别结果；根据所述最优识别结果进行领域判断，确定目标领域；采用所述目标领域对应的目标语言模型，对多个所述候选识别结果进行二次解码，获取目标识别结果。2.如权利要求1所述的领域自适应语音识别方法，其特征在于，所述对所述待识别语音数据进行一次解码，获取多个候选识别结果，从多个所述候选识别结果中获取最优识别结果，包括：采用声学模型对所述待识别语音数据进行解码处理，获取多个原始识别句子和每个所述原始识别句子对应的目标声学分值；采用通用语言模型对所述待识别语音数据进行解码处理，获取多个原始识别句子和每个所述原始识别句子对应的第一语言分值；根据多个所述原始识别句子对应的目标声学分值和第一语言分值进行处理，获取多个所述原始识别句子对应的第一识别分值；对多个所述原始识别句子对应的第一识别分值进行排序，将第一识别分值大的前N个原始识别句子，确定为多个候选识别结果，N≥2；从多个所述候选识别结果中，选取第一识别分值最大的一个原始识别句子，确定为最优识别结果。3.如权利要求2所述的领域自适应语音识别方法，其特征在于，所述候选识别结果包括候选识别句子和所述候选识别句子对应的目标声学分值；所述采用所述目标领域对应的目标语言模型，对多个所述候选识别结果进行二次解码，获取目标识别结果，包括：采用所述目标领域对应的目标语言模型，对多个所述候选识别结果进行二次解码，获取多个所述候选识别句子和每个所述候选识别句子对应的第二语言分值；对每个所述候选识别句子对应的第二语言分值和所述目标声学分值进行处理，获取每个所述候选识别句子对应的第二识别分值；依据所述第二识别分值对多个所述候选识别句子进行排序，将所述第二识别分值最大的候选识别句子，确定为目标识别结果。4.如权利要求3所述的领域自适应语音识别方法，其特征在于，所述候选识别结果还包括所述候选识别句子对应的第一语言分值；所述对每个所述候选识别句子对应的第二语言分值和所述目标声学分值进行处理，获取每个所述候选识别句子对应的第二识别分值，包括：根据每个所述候选识别句子对应的第一语言分值和第二语言分值，确定每个所述候选识别句子对应的目标语言分值；对每个所述候选识别句子对应的目标语言分值和每个所述候选识别句子对应的目标声学分值进行处理，获取每个所述候选识别句子对应...

【专利技术属性】
技术研发人员：赵梦原，王健宗，程宁，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人