一种智能客服模型的训练方法和系统技术方案

技术编号：40199852 阅读：6 留言：0更新日期：2024-01-27 00:04

本申请涉及一种智能客服模型的训练方法和系统，其中，该方法包括：通过初步训练后的智能客服模型得到未标注样本的预测答案；若预测答案为错误答案，则对错误答案对应的未标注样本进行人工标注，得到第一标注样本；若预测答案为正确答案，则基于标准问题库对未标注样本进行自动标注，得到第二标注样本；基于第一标注样本和第二标注样本，完成智能客服模型的最终训练。通过本申请，解决了如何训练精准度高且成本低的智能客服模型的问题，实现了通过初步训练的智能客服模型对未标注样本进行有针对性的筛选标注，降低训练样本标注的成本，基于筛选标注后的样本完成智能客服模型的最终训练，有效提高模型精度。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及机器学习，特别是涉及一种智能客服模型的训练方法和系统。

技术介绍

1、现有的智能客服模型主要分为有监督和无监督两种，无监督方法主要代表是simcse模型，simcse算法就是使用droupout来对文本增加噪音，从而构造一个正样本对，而负样本对则是在batch中选取的其它句子，然而由于这种方式缺乏标签数据，从而导致模型的准确率较低，一般情况下难以直接应用在实际业务中。另外一种方式是基于有监督模型训练进行的，这种方法前期需要收集大量的有标注样本，然后再通过深度学习的方式进行模型的训练和预测。这种方法一般情况下精度较高，也是目前较为常用的方法。但是标准数据的成本过高，无法实现大量样本的标注。

2、目前针对相关技术中如何训练精准度高且成本低的智能客服模型的问题，尚未提出有效的解决方案。

技术实现思路

1、本申请实施例提供了一种智能客服模型的训练方法和系统，以至少解决相关技术中如何训练精准度高且成本低的智能客服模型。

2、第一方面，本申请实施例提供了一种智能客服模型的训练方法，所述方法包括：

3、通过初步训练后的智能客服模型得到未标注样本的预测答案；

4、若所述预测答案为错误答案，则对所述错误答案对应的未标注样本进行人工标注，得到第一标注样本；

5、若所述预测答案为正确答案，则基于标准问题库对所述未标注样本进行自动标注，得到第二标注样本；

6、基于所述第一标注样本和所述第二标注样本，完成所述智能客服模型的最终训练。

7、在其中一些实施例中，在通过所述初步训练后的智能客服模型得到未标注样本的预测答案之前，所述方法包括：

8、构建标准问题库，基于所述标准问题库得到已标注样本；

9、基于所述已标注样本完成智能客服模型的初步训练。

10、在其中一些实施例中，基于所述已标注样本完成智能客服模型的初步训练包括：

11、若所述已标注样本的样本量小于预设阈值，则根据训练样本集中的已标注样本，完成对基于传统机器学习算法的智能客服模型的初步训练；

12、若所述已标注样本的样本量大于等于预设阈值，则根据训练样本集中的已标注样本，完成对基于深度学习算法的智能客服模型的初步训练。

13、在其中一些实施例中，对所述错误答案对应的未标注样本进行人工标注包括：

14、基于所述错误答案的预测分数，计算得到对应的未标注样本的不确定性分数；

15、对所述错误答案对应的未标注样本进行样本聚类，基于所述样本聚类的结果，计算得到每个未标注样本的代表性分数；

16、基于所述不确定性分数和所述代表性分数，计算得到所述未标注样本的样本信息量；

17、从所述未标注样本中取出所述样本信息量最高的b个未标注样本进行人工标注。

18、在其中一些实施例中，基于所述错误答案的预测分数，计算得到对应的未标注样本的不确定性分数包括：

19、通过公式 u( x) = 1- abs( pred_ score( x) - 0.5) 计算得到对应的未标注样本的不确定性分数，其中， pred_ score( x)表示错误答案的预测分数， abs( )表示取绝对值。

20、在其中一些实施例中，基于所述样本聚类的结果，计算得到每个未标注样本的代表性分数包括：

21、通过公式计算得到每个未标注样本的代表性分数，其中， c( x i)表示未标注样本 x i所属的聚类簇中的全部未标注样本， d( x i , m)表示未标注样本 x i与未标注样本 m之间欧氏距离。

22、在其中一些实施例中，基于所述不确定性分数和所述代表性分数，计算得到所述未标注样本的样本信息量包括：

23、通过公式 i( x i)= r( x i)'+ u( x i)计算得到所述未标注样本的样本信息量，其中， u( x)表示未标注样本 x i的不确定性分数，表示代表性分数的归一化处理， min( r( x)) 表示所有未标注样本中最小的代表性分数， r( x i)表示未标注样本 x i的代表性分数。

24、在其中一些实施例中，基于标准问题库对所述未标注样本进行自动标注包括：

25、计算标准问题库的问题与所述未标注样本之间的相似度；

26、确定与所述未标注样本相似度最大的标准问题库的问题，通过所述标准问题库的问题对所述未标注样本进行自动标注。

27、在其中一些实施例中，所述方法包括：

28、对于初步训练后的智能客服模型得到未标注样本的预测答案，若返回的是转接人工客服的请求，则所述预测答案为错误答案，若没有返回转接人工客服的请求则所述预测答案为正确答案。

29、第二方面，本申请实施例提供了一种智能客服模型的训练系统，所述系统用于执行上述第一方面所述的方法，所述系统包括模型初步训练模块、训练样本生成模块和模型最终训练模块；

30、所述模型初步训练模块，用于通过初步训练后的智能客服模型得到未标注样本的预测答案；

31、所述训练样本生成模块，用于判断所述预测答案，若所述预测答案为错误答案，则对所述错误答案对应的未标注样本进行人工标注，得到第一标注样本；若所述预测答案为正确答案，则基于标准问题库对所述未标注样本进行自动标注，得到第二标注样本；

32、所述模型最终训练模块，用于根据所述第一标注样本和所述第二标注样本文档来自技高网...

【技术保护点】

1.一种智能客服模型的训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，在通过所述初步训练后的智能客服模型得到未标注样本的预测答案之前，所述方法包括：

3.根据权利要求2所述的方法，其特征在于，基于所述已标注样本完成智能客服模型的初步训练包括：

4.根据权利要求1所述的方法，其特征在于，对所述错误答案对应的未标注样本进行人工标注包括：

5.根据权利要求4所述的方法，其特征在于，基于所述错误答案的预测分数，计算得到对应的未标注样本的不确定性分数包括：

6.根据权利要求4所述的方法，其特征在于，基于所述样本聚类的结果，计算得到每个未标注样本的代表性分数包括：

7.根据权利要求4所述的方法，其特征在于，基于所述不确定性分数和所述代表性分数，计算得到所述未标注样本的样本信息量包括：

8.根据权利要求1所述的方法，其特征在于，基于标准问题库对所述未标注样本进行自动标注包括：

9.根据权利要求1所述的方法，其特征在于，所述方法包括：

10.一种智能客服模型

...

【技术特征摘要】

1.一种智能客服模型的训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，在通过所述初步训练后的智能客服模型得到未标注样本的预测答案之前，所述方法包括：

3.根据权利要求2所述的方法，其特征在于，基于所述已标注样本完成智能客服模型的初步训练包括：

4.根据权利要求1所述的方法，其特征在于，对所述错误答案对应的未标注样本进行人工标注包括：

5.根据权利要求4所述的方法，其特征在于，基于所述错误答案的预测分数，计算得到对应的未标注样本的不确定性分数包括：

6.根据权利要求4所述...

【专利技术属性】
技术研发人员：李朝，黄家明，杨建燮，胡始昌，肖劼，杨斌，
申请(专利权)人：杭州宇谷科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人