语音识别方法、训练语音识别模型的方法及对应装置制造方法及图纸

技术编号：29590368 阅读：16 留言：0更新日期：2021-08-06 19:50

本公开公开了一种语音识别方法、训练语音识别模型的方法及对应装置，涉及语音和深度学习技术领域。具体实现方案为：获取语音识别模型针对待识别语音输出的识别得分排在前N个的候选识别结果，所述N为大于1的正整数；利用实体打分模型分别对所述N个候选识别结果进行打分，得到各候选识别结果的实体得分；综合所述候选识别结果的识别得分和实体得分，从所述N个候选识别结果中确定所述待识别语音对应的识别结果；其中，所述实体打分模型是基于用户对特定类型的实体的识别结果满意度状况预先训练得到的。本公开能够提高识别准确性。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、训练语音识别模型的方法及对应装置
本公开涉及计算机应用
，尤其涉及语音和深度学习

技术介绍
近几十年来，语音识别技术取得显著进步，逐步进入了工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。在现有的语音识别架构中，使用音频训练数据进行语音识别模型中声学模型的训练，使用文本训练数据进行语音识别模型中语言模型的训练，如图1中所示。解码器利用声学模型进行语音到音节的概率计算，利用语言模型进行从音节到文本的概率计算，最终输出概率得分最高的文本作为语音识别结果。然而，在一些垂直领域或专业领域的语音识别场景下，对于一些特定实体的识别准确性较低。例如，在地图类应用领域，由于POI(PointOfInterest，兴趣点)或地点文本不同于普通语言的语义逻辑，因此对于POI或地点文本的识别准确率较低。再例如，在医学应用领域，由于疾病、药物等专业名词的文本也不同于普通语言的语义逻辑，因此对于疾病、药物等专业名词的文本的识别准确率也较低。
技术实现思路
有鉴于此，本公开提供了一种语音识别方法和装置，以便于提高识别准确性。根据本公开的第一方面，提供了一种语音识别方法，包括：获取语音识别模型针对待识别语音输出的识别得分排在前N个的候选识别结果，所述N为大于1的正整数；利用实体打分模型分别对所述N个候选识别结果进行打分，得到各候选识别结果的实体得分；综合所述候选识别结果的识别得分和实体得分，从所述N个候选识别结果中确定所述待识别语音对应的...

【技术保护点】
1.一种语音识别方法，包括：/n获取语音识别模型针对待识别语音输出的识别得分排在前N个的候选识别结果，所述N为大于1的正整数；/n利用实体打分模型分别对所述N个候选识别结果进行打分，得到各候选识别结果的实体得分；/n综合所述候选识别结果的识别得分和实体得分，从所述N个候选识别结果中确定所述待识别语音对应的识别结果；/n其中，所述实体打分模型是基于用户对特定类型的实体的识别结果满意度状况预先训练得到的。/n

【技术特征摘要】
1.一种语音识别方法，包括：
获取语音识别模型针对待识别语音输出的识别得分排在前N个的候选识别结果，所述N为大于1的正整数；
利用实体打分模型分别对所述N个候选识别结果进行打分，得到各候选识别结果的实体得分；
综合所述候选识别结果的识别得分和实体得分，从所述N个候选识别结果中确定所述待识别语音对应的识别结果；
其中，所述实体打分模型是基于用户对特定类型的实体的识别结果满意度状况预先训练得到的。

2.根据权利要求1所述的方法，其中，所述用户对特定类型实体的识别结果满意度状况采用如下方式预先确定：
在用户下发语音请求后，收集用户针对包含所述特定类型的实体的识别结果的行为数据；
基于所述特定类型的各实体分别统计所述行为数据；
依据统计的所述行为数据确定所述特定类型的各实体的识别结果满意度。

3.根据权利要求2所述的方法，其中，所述依据统计的所述行为数据确定所述特定类型的各实体的识别结果满意度包括：
依据对包含所述特定类型的实体的识别结果的直接搜索行为，确定第一满意度；
依据对包含所述特定类型的实体的识别结果进行修改后搜索的行为，确定第二满意度；
依据对包含所述特定类型的实体的识别结果重新发起语音请求且重新发起请求的识别结果与上一次识别结果相似的行为，确定第三满意度；
依据对包含所述特定类型的实体的识别结果重新发起两次以上的语音请求且重新发起请求的识别结果与上一次识别结果不相似的行为，确定第四满意度；
所述第一满意度大于第二满意度，所述第二满意度大于第三满意度，所述第三满意度大于第四满意度。

4.根据权利要求1所述的方法，其中，所述实体打分模型采用如下方式预先训练得到：
获取训练样本，训练样本包含所述特定类型的实体的识别结果，以及依据所述识别结果对应的满意度状况标注的评分标签；
将训练样本中的识别结果作为机器学习模型的输入，将该识别结果对应的评分标签作为机器学习模型的目标输出，训练所述机器学习模型得到所述实体打分模型。

5.根据权利要求1所述的方法，其中，所述综合所述候选识别结果的识别得分和实体得分，从所述N个候选识别结果中确定所述待识别语音对应的识别结果包括：
将所述候选识别结果的识别得分和实体得分进行加权求和，得到所述N个候选识别结果的最终得分；
利用所述最终得分确定所述待识别语音对应的识别结果。

6.根据权利要求1至5中任一项所述的方法，其中，所述特定类型的实体包括：兴趣点POI或地点。

7.一种训练语音识别模型的方法，包括：
在训练语音识别模型的过程中，利用实体打分模型对所述语音识别模型的输出文本进行打分，得到该输出文本的实体得分；
利用所述实体得分，调整所述语音识别模型对该输出文本所包含特定类型的实体的学习率；
其中所述实体打分模型是基于用户对特定类型的实体的识别结果满意度状况预先训练得到的。

8.根据权利要求7所述的方法，其中，所述利用所述实体得分，调整所述语音识别模型对该输出文本所包含特定类型的实体的学习率包括：
依据所述实体得分，调整声学模型对所述输出文本所包含特定类型的实体对应的语音样本的学习率；和/或，
依据所述实体得分，调整语言模型对所述输出文本所包含特定类型的实体所对应音素序列的学习率。

9.根据权利要求8所述的方法，其中，所述实体得分与调整的声学模型的学习率负相关；
所述实体得分与调整的语言模型的学习率正相关。

10.根据权利要求7所述的方法，所述用户对特定类型实体的识别结果满意度状况采用如下方式预先确定：
在用户下发语音请求后，收集用户针对包含所述特定类型的实体的识别结果的行为数据；
基于所述特定类型的各实体分别统计所述行为数据；
依据所述行为数据确定所述特定类型的各实体的识别结果满意度。

11.根据权利要求7所述的方法，所述实体打分模型采用如下方式预先训练得到：
获取训练样本，训练样本包含所述特定类型的实体的识别结果，以及依据所述识别结果对应的满意度状况标注的评分标签；
将训练样本中的识别结果作为机器学习模型的输入，将该识别结果对应的评分标签作为机器学习模型的目标输出，训练所述机器学习模型得到所述实体打分模型。

12.一种语音识别装置，包括：
候选获取单元，用于获取语音识别模型针对待识别语音输出的识别得分排在前N个的候选识别结果，所述N为大于1的正整数；
实体打分单元，用于利用实体打分模...

【专利技术属性】
技术研发人员：张辽，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人