一种训练分类模型的方法及系统技术方案

技术编号：23149269 阅读：45 留言：0更新日期：2020-01-18 13:32

本说明书实施例公开了一种训练分类模型的方法及系统。所述方法包括：获取至少一个问题对，将所述至少一个问题对输入初始分类模型，确定所述至少一个问题对中每一个的初始分类结果；基于所述初始分类结果，确定所述至少一个问题对中每一个的匹配模型，将所述至少一个问题对输入对应的所述匹配模型，确定所述至少一个问题对的第一匹配结果；基于所述第一匹配结果以及所述至少一个问题对标定的第二匹配结果，得到反馈值；根据所述反馈值调整所述初始分类模型，得到目标分类模型。

A method and system of training classification model

全部详细技术资料下载

【技术实现步骤摘要】
一种训练分类模型的方法及系统
本说明书实施例涉及数据处理领域，特别涉及一种训练分类模型的方法、系统。
技术介绍
随着计算机技术的发展，自动问答系统在生活中越来越普遍，为人们的生活带来了多种便利。例如通过识别用户输入的文字和/或语音问题，自动回复与该问题对应的答案，从而解决用户的疑问和需求。传统的问答系统中通常是采用规则分类方式来对问题对进行分类，或者基于大量人工标记的训练样本训练的分类模型对问题对进行分类。如何有效提高对问题对分类的效率和通用性成为目前需要解决的技术问题。
技术实现思路
本说明书的一个方面提供一种训练分类模型的方法，所述方法包括：获取至少一个问题对，将所述至少一个问题对输入初始分类模型，确定所述至少一个问题对中每一个的初始分类结果；基于所述初始分类结果，确定所述至少一个问题对中每一个的匹配模型，将所述至少一个问题对输入对应的所述匹配模型，确定所述至少一个问题对的第一匹配结果；基于所述第一匹配结果以及所述至少一个问题对标定的第二匹配结果，得到反馈值；根据所述反馈值调整所述初始分类模型，得到目标分类模型。本说明书的另一个方面提供一种对目标问题对进行分类的方法，所述方法包括：采用所述的目标分类模型对目标问题对进行分类，得到所述目标问题对的目标分类结果。本说明书的另一个方面提供一种训练分类模型的系统，所述系统包括训练模块，用于获取至少一个问题对，将所述至少一个问题对输入初始分类模型，确定所述至少一个问题对中每一个的初始分类结果；基于所述初始分类结果，确定所述至少一个...

【技术保护点】
1.一种训练分类模型的方法，包括：/n获取至少一个问题对，将所述至少一个问题对输入初始分类模型，确定所述至少一个问题对中每一个的初始分类结果；/n基于所述初始分类结果，确定所述至少一个问题对中每一个的匹配模型，将所述至少一个问题对输入对应的所述匹配模型，确定所述至少一个问题对的第一匹配结果；/n基于所述第一匹配结果以及所述至少一个问题对标定的第二匹配结果，得到反馈值；/n根据所述反馈值调整所述初始分类模型，得到目标分类模型。/n

【技术特征摘要】
1.一种训练分类模型的方法，包括：
获取至少一个问题对，将所述至少一个问题对输入初始分类模型，确定所述至少一个问题对中每一个的初始分类结果；
基于所述初始分类结果，确定所述至少一个问题对中每一个的匹配模型，将所述至少一个问题对输入对应的所述匹配模型，确定所述至少一个问题对的第一匹配结果；
基于所述第一匹配结果以及所述至少一个问题对标定的第二匹配结果，得到反馈值；
根据所述反馈值调整所述初始分类模型，得到目标分类模型。

2.如权利要求1所述的方法，所述基于所述第一匹配结果以及所述至少一个问题对标定的第二匹配结果，得到反馈值包括：
判断所述至少一个问题对中每一个的所述第一匹配结果和所述至少一个问题对中每一个的所述第二匹配结果是否一致；
基于所述判断结果，计算所述匹配模型的准确值；
将所述准确值确定为所述反馈值。

3.如权利要求2所述的方法，所述准确值为所述匹配模型的F-1分数，所述F-1分数是综合准确率和召回率的模型综合评价指标。

4.如权利要求1所述的方法，所述根据所述反馈值调整所述初始分类模型，得到目标分类模型包括：
基于所述初始分类模型的第一损失函数和所述反馈值，调整所述初始分类模型的参数，当调整后的中间分类模型当前的损失函数第二损失函数满足第一预设条件，确定当前中间分类模型为所述目标分类模型。

5.如权利要求1所述的方法，所述匹配模型通过以下训练方式获得：
获取多个样本对，所述样本对为问题对；
对所述多个样本对进行分类，确定所述多个样本对的至少一个分类结果；
根据所述至少一个分类结果，将所述多个样本对分别输入至少一个初始匹配模型进行训练，获得与所述至少一个分类结果对应的至少一个所述匹配模型。

6.如权利要求1所述的方法，将输入所述匹配模型的所述问题对进行向量表示。

7.如权利要求6所述的方法，通过编码器对所述问题对进行向量表示。

8.如权利要求7所述的方法，与所述初始分类结果对应的不同的所述匹配模型共用一个编码器。

9.如权利要求1所述的方法，所述匹配模型包括：BERT、EMIS、CNN或LSTM。

10.一种对目标问题对进行分类的方法，包括：
采用如权利要求1所述的目标分类模型对目标问题对进行分类，得到所述目标问题对的目标分类结果。

11.一种训练分类模型的系统...

【专利技术属性】
技术研发人员：陈晓军，崔恒斌，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人