一种语音识别模型的训练方法和装置制造方法及图纸

技术编号：19483205 阅读：22 留言：0更新日期：2018-11-17 10:56

本申请实施例涉及人工智能领域，尤其涉及一种语音识别模型的训练方法和装置。本申请实施例提供一种语音识别模型的训练方法，包括：向语音识别模型输入语音，从语音识别模型的输出侧得到语音对应的N个文本，将N个文本中的每个文本与预设数据库中存储的多个文本进行匹配，得到N个文本对应的N个匹配程度值，根据N个匹配程度值和预设条件，将N个匹配程度值中的满足预设条件的匹配程度值对应的文本确定为目标文本，将语音和目标文本作为语音识别模型的训练数据，对语音识别模型进行训练。由于可以直接通过由语音识别模型得到的N个文本进行删选处理，确定出目标文本，不再需要人工标注得到就可以获取目标文本，如此可以节省人工成本。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音识别模型的训练方法和装置
本申请实施例涉及人工智能领域，尤其涉及一种语音识别模型的训练方法和装置。
技术介绍
人工智能(ArtificialIntelligence，AI)是研究和开发用于模拟、延伸和扩展人的智能的理论、方法、技术即应用系统的一门新的技术科学，人工智能是计算机科学的一个分支，人工智能领域的研究包括机器人、语音识别、图像识别和自然语言处理等等。其中，语音识别作为人工智能领域的一个重要技术，被应用于互联网，通信、智能家居等相关的各行各业。为了得到语音识别模型，需要准备大量的语音数据和与该大量的语音数据对应的文本数据来训练，现有技术中，该文本数据是通过如下的方式获取的：组织大量的人听取语音数据，并写下正确的文本数据。然而，随着算法和计算机能力的进步，语音识别模型允许越来越多的语音数据和对应的文本数据加入训练，以提升语音识别模型的准确度，这使得人工成本成为资源投入的瓶颈。
技术实现思路
本申请实施例提供一种语音识别模型的训练方法和装置，用于节约人工成本。本申请实施例提供一种语音识别模型的训练方法，包括：向语音识别模型输入语音，从语音识别模型的输出侧得到语音对应的N个文本，N为正整数，将N个文本中的每个文本与预设数据库中存储的多个文本进行匹配，得到N个文本对应的N个匹配程度值，其中，N个文本与N个匹配程度值一一对应，根据N个匹配程度值和预设条件，将N个匹配程度值中的满足预设条件的匹配程度值对应的文本确定为目标文本，将语音和目标文本作为语音识别模型的训练数据，对语音识别模型进行训练。由于可以直接通过由语音识别模型得到的N个文本进行删选处理，得到N个...

【技术保护点】
1.一种语音识别模型的训练方法，其特征在于，包括：向语音识别模型输入语音，从所述语音识别模型的输出侧得到所述语音对应的N个文本，所述N为正整数；将所述N个文本中的每个文本与预设数据库中存储的多个文本进行匹配，得到所述N个文本对应的N个匹配程度值，其中，所述N个文本与所述N个匹配程度值一一对应；根据所述N个匹配程度值和预设条件，将所述N个匹配程度值中的满足预设条件的匹配程度值对应的文本确定为目标文本；将所述语音和所述目标文本作为所述语音识别模型的训练数据，对所述语音识别模型进行训练。

【技术特征摘要】
1.一种语音识别模型的训练方法，其特征在于，包括：向语音识别模型输入语音，从所述语音识别模型的输出侧得到所述语音对应的N个文本，所述N为正整数；将所述N个文本中的每个文本与预设数据库中存储的多个文本进行匹配，得到所述N个文本对应的N个匹配程度值，其中，所述N个文本与所述N个匹配程度值一一对应；根据所述N个匹配程度值和预设条件，将所述N个匹配程度值中的满足预设条件的匹配程度值对应的文本确定为目标文本；将所述语音和所述目标文本作为所述语音识别模型的训练数据，对所述语音识别模型进行训练。2.如权利要求1所述的方法，其特征在于，所述将所述N个文本中的每个文本与预设数据库中存储的多个文本进行匹配，得到所述N个文本对应的N个匹配程度值，根据所述N个匹配程度值和预设条件，将所述N个匹配程度值中的满足预设条件的匹配程度值对应的文本确定为目标文本，包括：将所述N个文本中的每个文本与第一预设数据库中存储的多个文本进行匹配，得到所述N个文本对应的N个第一匹配程度值，其中，所述N个文本与所述N个第一匹配程度值一一对应；从所述N个第一匹配程度值中确定出大于第一阈值的M个第一匹配程度值，所述M为不大于所述N的正整数；根据所述M个第一匹配程度值对应的M个文本，从所述M个文本中确定出所述目标文本。3.如权利要求2所述的方法，其特征在于，针对所述N个文本中的每个文本，所述文本对应的第一匹配程度值是根据所述第一预设数据库中存储的多个文本与所述文本相匹配的数量确定的。4.如权利要求2所述的方法，其特征在于，所述根据所述M个第一匹配程度值对应的M个文本，从所述M个文本中确定出所述目标文本，包括：将所述M个第一匹配程度值对应的M个文本与第二预设数据库中存储的多个文本进行匹配，得到所述M个文本对应的M个第二匹配程度值，其中，所述M个文本与所述M个第二匹配程度值一一对应；从所述M个第二匹配程度值中确定出大于第二阈值的K个第二匹配程度值，所述K为不大于所述M的正整数；根据所述K个第二匹配程度值对应的K个文本，从所述K个文本中确定出所述目标文本。5.如权利要求4所述的方法，其特征在于，针对所述M个文本中的每个文本，所述文本对应的第二匹配程度值是根据所述第二预设数据库中存储的...

【专利技术属性】
技术研发人员：张卓，
申请(专利权)人：上海依图网络科技有限公司，上海图智安网络科技有限公司，深圳依图信息技术有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人