语音识别方法、设备、计算机可读存储介质及程序产品技术

技术编号：28678381 阅读：19 留言：0更新日期：2021-06-02 02:55

本申请提供了一种语音识别方法、设备、计算机可读存储介质及程序产品，所述方法包括：获取待识别语音信息和上文识别结果，所述上文识别结果为所述待识别语音信息的上文语音信息的语音识别结果；对所述待识别语音信息进行识别，得到多个候选识别结果；分别将所述上文识别结果与各个候选识别结果输入至训练好的匹配模型，得到各个匹配结果，所述各个匹配结果包括所述上文识别结果与所述各个候选识别结果的相关度；基于所述各个匹配结果，从所述多个候选识别结果中确定目标识别结果。如此，通过结合上文内容对待识别语音进行关联识别，能够使识别结果符合实际对话场景，实现基于上文内容的语音识别，能够提高语音识别结果的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、设备、计算机可读存储介质及程序产品
本申请涉及人工智能
，涉及但不限于一种语音识别方法、设备、计算机可读存储介质及程序产品。
技术介绍
随着智能设备的发展，语音交互成为一个重要的互动方式，自动语音识别(ASR，AutomaticSpeechRecognition)技术也变得尤为重要。在语音对话场景下，相关技术中ASR主要是采用模式匹配法：在训练阶段，用户将词汇表中的每一词依次说一遍，并且将其特征矢量作为模板存入模板库；在识别阶段，将待识别语音的特征矢量依次与模板库中的每个模板进行相似度比较，将相似度最高者确定为识别结果。相关技术中基于模式匹配的语音识别方法，由于环境噪音影响、模板库中存在的多个同音模板等情况，导致识别结果的准确率较低。例如模板库中存在“事实”与“适时”两个模板，采用相关技术中基于模式匹配法的ASR，无法根据当前待识别语音确定哪一模板的准确率更高，存在将“事实”误识别为“适时”、或者将“适时”误识别为“事实”的情况，使得识别结果不符合实际对话场景，导致语音识别结果准确率低。
技术实现思路
本申请实施例提供一种语音识别方法、装置、设备、计算机可读存储介质及计算机程序产品，实现基于上文的语音识别，能够提高语音识别结果的准确率。本申请实施例的技术方案是这样实现的：本申请实施例提供一种语音识别方法，所述方法包括：获取待识别语音信息和上文识别结果，所述上文识别结果为所述待识别语音信息的上文语音信息的语音识别结果；对所述待识别语音信息进行识别，...

【技术保护点】
1.一种语音识别方法，其特征在于，所述方法包括：/n获取待识别语音信息和上文识别结果，所述上文识别结果为所述待识别语音信息的上文语音信息的语音识别结果；/n对所述待识别语音信息进行识别，得到多个候选识别结果；/n分别将所述上文识别结果与各个候选识别结果输入至训练好的匹配模型，得到各个匹配结果，所述各个匹配结果包括所述上文识别结果与所述各个候选识别结果的相关度；/n基于所述各个匹配结果，从所述多个候选识别结果中确定目标识别结果。/n

【技术特征摘要】
1.一种语音识别方法，其特征在于，所述方法包括：
获取待识别语音信息和上文识别结果，所述上文识别结果为所述待识别语音信息的上文语音信息的语音识别结果；
对所述待识别语音信息进行识别，得到多个候选识别结果；
分别将所述上文识别结果与各个候选识别结果输入至训练好的匹配模型，得到各个匹配结果，所述各个匹配结果包括所述上文识别结果与所述各个候选识别结果的相关度；
基于所述各个匹配结果，从所述多个候选识别结果中确定目标识别结果。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：
获取正样本数据集和负样本数据集，所述正样本数据集中的各个正样本数据包括相关度大于或等于预设阈值的训练上文文本数据和训练文本数据，所述负样本数据集中的各个负样本数据包括相关度小于预设阈值的训练上文文本数据和训练文本数据；
获取所述各个正样本数据对应的标注相关度和各个负样本数据对应的标注相关度；
基于所述各个正样本数据、所述各个正样本数据对应的标注相关度、所述各个负样本数据和所述各个负样本数据对应的标注相关度对预设匹配模型进行训练，得到训练好的匹配模型。

3.根据权利要求2所述的方法，其特征在于，所述获取正样本数据集，包括：
获取训练数据集，所述训练数据集中各个训练数据包括训练语音数据和所述训练语音数据的训练上文语音数据；
获取各个训练语音数据对应的训练文本数据和各个训练上文语音数据对应的训练上文文本数据；
将一个训练数据对应的训练上文文本数据和训练文本数据确定为一个正样本数据；
将各个训练数据确定的各个正样本数据确定为正样本数据集。

4.根据权利要求3所述的方法，其特征在于，获取负样本数据集，包括：
获取各个训练语音数据对应的至少一个训练候选文本数据，所述训练候选文本数据不同于所述训练文本数据；
将一个训练数据对应的训练上文文本数据和一个训练候选文本数据确定为一个负样本数据；
将各个训练数据确定的各个负样本数据确定为负样本数据集。

5.根据权利要求3所述的方法，其特征在于，获取负样本数据集，包括：
从所述各个训练数据中获取除一个训练数据以外的剩余训练数据；
从所述剩余训练数据中随机选取另一个训练数据；
将所述一个训练数据对应的训练上文文本数据和所述另一个训练数据对应的训练文本数据确定为一个负样本数据；
将各个训练数据确定的各个负样本数据确定为负样本数据集。

6.根据权利要求3所述的方法，其特征在于，所述基于所述各个正样本数据、所述各个正样本数据对应的标注相关度、所述各个负样本数据和所述...

【专利技术属性】
技术研发人员：连荣忠，陈潮涛，彭金华，姜迪，徐倩，杨强，
申请(专利权)人：深圳前海微众银行股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人