模型训练方法和装置制造方法及图纸

技术编号：19697446 阅读：19 留言：0更新日期：2018-12-08 12:38

本发明专利技术提供一种模型训练方法和装置。该方法，包括：接收终端发送的语音数据；通过第一语音识别模型对所述语音数据进行识别，获得第一文本信息；接收用户通过终端输入的所述语音数据对应的第二文本信息和所述第一文本信息对应的语义信息；对所述第二文本信息进行训练，得到第二语音识别模型，并且对所述语义信息进行训练，得到语义识别模型。该方法提高了语义模型输出结果准确度。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法和装置
本专利技术涉及人工智能
，尤其涉及一种模型训练方法和装置。
技术介绍
在涉及到语音和语义的人工智能应用场景中，除了需要训练语音模型，还需训练语义模型。比如用户通过语音输入一个命令，系统不仅需要识别语音，还要根据该语音识别用户的意图，这种场景下就需要保证语音识别和语义识别都有很高的准确率。现有技术中，一方面，通过人工听写的方式获取语音样本对应的文本，然后对该文本进行训练，得到语音模型；另一方面，在得到上述文本的基础上，通过人工方式对该文本进行语义标注，然后对标注后的文本进行训练，得到语义模型。在实际应用时，首先将待处理的语音输入上述语音模型，得到对应的文本，然后再将该文本输入上述语义模型中，获得用户通过上述待处理语音想要表达的意图。但是，由于上述语义模型是在人工听写的“完美”文本的基础上训练得到的，而在实际应用过程中，输入该语义模型的是由语音模型输出的存在信息折损的文本，因此，现有技术中的语义模型在实际应用过程中，会由于输入信息的不对称而导致输出结果不准确。
技术实现思路
本专利技术提供一种模型训练方法和装置，用于提高语义模型输出结果准确度。第一方面，本专利技术提供一种模型训练方法，包括：步骤A：接收终端发送的语音数据；步骤B：通过第一语音识别模型对所述语音数据进行识别，获得第一文本信息；步骤C：接收用户通过终端输入的所述语音数据对应的第二文本信息和所述第一文本信息对应的语义信息；步骤D：对所述第二文本信息进行训练，得到第二语音识别模型，并且对所述语义信息进行训练，得到语义识别模型。可选的，所述接收用户通过终端输入的所述语音数据对应的第...

【技术保护点】
1.一种模型训练方法，其特征在于，应用于服务器，包括：步骤A：接收终端发送的语音数据；步骤B：通过第一语音识别模型对所述语音数据进行识别，获得第一文本信息；步骤C：接收用户通过终端输入的所述语音数据对应的第二文本信息和所述第一文本信息对应的语义信息；步骤D：对所述第二文本信息进行训练，得到第二语音识别模型，并且对所述语义信息进行训练，得到语义识别模型。

【技术特征摘要】
1.一种模型训练方法，其特征在于，应用于服务器，包括：步骤A：接收终端发送的语音数据；步骤B：通过第一语音识别模型对所述语音数据进行识别，获得第一文本信息；步骤C：接收用户通过终端输入的所述语音数据对应的第二文本信息和所述第一文本信息对应的语义信息；步骤D：对所述第二文本信息进行训练，得到第二语音识别模型，并且对所述语义信息进行训练，得到语义识别模型。2.根据权利要求1所述的方法，其特征在于，所述接收用户通过终端输入的所述语音数据对应的第二文本信息和所述第一文本信息对应的语义信息之前，所述方法还包括：将所述第一文本信息发送给所述终端。3.根据权利要求1或2所述的方法，其特征在于，所述对所述语音数据进行识别，获得第一文本信息之前，所述方法还包括：对所述语音数据进行切分处理，获得至少一个语音片；所述对所述语音数据进行识别，获得第一文本信息，包括：分别对所述至少一个语音片中的每个语音片进行识别，获得至少一个文本信息；将所述至少一个文本信息确定为所述第一文本信息。4.根据权利要求3所述的方法，其特征在于，所述语音数据包括至少两路音频数据；所述对所述语音数据进行切分处理，获得至少一个语音片之前，包括：对所述语音数据中的至少两路音频数据进行时间对齐处理，获得处理后的语音数据；所述对所述语音数据进行切分处理，获得至少一个语音片，包括：对处理后的语音数据进行切分处理，获得至少一个语音片。5.根据权利要求4所述的方法，其特征在于，所述通过第一语音识别模型对所述语音数据进行识别，获得第一文本信息，包括：确定各所述语音片的起始时间；根据各所述起始时间和各所述语音片对应的文本信息，生成上下文信息；将所述上下文信息作为所述第一文本信息。6.根据权利要求1所述的方法，其特征在于，所述得到第二语音识别模型之后，所述方法还包括：将所述第二语音识别模型作为新的第一语音识别模型，并重复执行步骤B-步骤D，直至所述第一语音识别模型和所述第二语音识别模型相同。7.一种模型训练装置，其特征在于，包括：接收模块，用...

【专利技术属性】
技术研发人员：戴俊，刘瑛，先永春，常月，黄国瑞，张伟冬，赵亚男，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人