一种客诉识别模型的构建方法、客诉识别方法及装置制造方法及图纸

技术编号:38143441 阅读:11 留言:0更新日期:2023-07-08 09:59
本文涉及人工智能技术领域,尤其涉及一种客诉识别模型的构建方法、客诉识别方法及装置。包括将预先标注的客诉样本集和非客诉样本集经过层归一化处理,得到训练数据集;将训练数据集输入到双层双向LSTM网络进行训练;将每个样本最后一个字符的隐藏层输出组成第一向量;对全部样本的输出在列维度上分别进行最大池化操作和平均池化操作得到第二向量和第三向量;对第一向量、第二向量和第三向量输入到全连接层进行训练;在全连接层的输出结果与训练数据集中的标注情况之间的匹配度满足要求的情况下,得到客诉识别模型。通过本发明专利技术实施例,实现了对用户反馈的文本进行分析确定是否属于客户投诉,及时对客诉进行处理,提高满意度。度。度。

【技术实现步骤摘要】
一种客诉识别模型的构建方法、客诉识别方法及装置


[0001]本文涉及人工智能
,尤其涉及一种客诉识别模型的构建方法、客诉识别方法及装置。

技术介绍

[0002]客诉是指银行的客户向银行进行的投诉。目前银行大多通过制定专家规则、机器学习模型识别客户是否属于投诉,现有的专家规则、机器学习模型随着时间的推移,识别效果将大幅下降,需要不断的重新制定新的专家规则、训练新机器学习模型,耗费大量的人力物力。
[0003]现在亟需一种客诉识别模型的构建方法、客诉识别方法及装置,从而解决现有技术中识别客诉类型的时效性差的问题。

技术实现思路

[0004]为解决现有技术中的问题,本文实施例提供了一种客诉识别模型的构建方法、客诉识别方法及装置,实现了通过深度学习的方法对客诉数据进行识别,相比于现有技术中利用专家规则、机器学习模型进行预测的方法,大幅提高了识别的时效性。
[0005]为了解决上述技术问题中的任意一种,本文的具体技术方案如下:
[0006]一方面,本文实施例提供了一种客诉识别模型的构建方法,包括,
[0007]将预先标注的客诉样本集和非客诉样本集经过层归一化处理,得到训练数据集;
[0008]将所述训练数据集输入到双层双向LSTM网络进行训练,得到所述训练数据集中每个样本的输出;
[0009]将所述训练数据集中每个样本最后一个字符的隐藏层输出组成第一向量;
[0010]对所述训练数据集全部样本的输出在列维度上分别进行最大池化操作和平均池化操作,得到第二向量和第三向量;
[0011]对所述第一向量、第二向量和第三向量输入到全连接层进行训练;
[0012]在所述全连接层的输出结果与所述训练数据集中的标注情况之间的匹配度满足要求的情况下,得到客诉识别模型。
[0013]进一步地,将所述训练数据集输入到双层双向LSTM网络进行训练之前,所述方法还包括:对所述训练数据集进行数据清洗。
[0014]进一步地,所述数据清洗包括:
[0015]对超过所述双层双向LSTM网络输入的最大文本长度的样本进行截断处理,以便于对截断处理后的所述训练数据集输入到双层双向LSTM网络进行训练。
[0016]进一步地,所述方法还包括:
[0017]对文本长度小于所述最大文本长度的样本,按照所述最大文本长度对所述样本的内容进行填充;
[0018]对填充的内容进行屏蔽处理,以便于将屏蔽处理后的所述训练数据集输入到双层
双向LSTM网络进行训练。
[0019]进一步地,按照所述最大文本长度对所述样本的内容进行填充进一步包括:
[0020]在所述样本的内容最后连续填充多个预定字符,直至填充预定字符后的样本的文本长度等于所述最大文本长度。
[0021]进一步地,对填充的内容进行屏蔽处理进一步包括:
[0022]对填充的内容进行标记,以便于在双层双向LSTM神经网络的训练过程中,根据所述标记确定不参加计算的所述填充的内容。
[0023]进一步地,所述数据清洗还包括:
[0024]对所述训练数据集进行脱敏处理,以便于对脱敏处理后的所述训练数据集输入到双层双向LSTM网络进行训练。
[0025]进一步地,所述方法还包括:
[0026]每对所述训练数据集中的全部样本进行一次训练后,根据所述全连接层的输出结果和所述训练数据集中的标注情况计算客诉识别模型正确率;
[0027]在所述正确率超过预设门限值且大于前后预定次训练对应的正确率时,将该正确率对应的所述客诉识别模型作为最终的客诉识别模型。
[0028]进一步地,计算所述全连接层的输出结果与所述标注情况之间的匹配度进一步包括:
[0029]对所述全连接层的输出结果进行argmax操作,得到所述训练数据集的样本分类情况;
[0030]计算所述样本分类情况和所述标注情况之间的匹配度。
[0031]基于同一专利技术构思,本专利技术实施例还提供了一种客诉识别方法,所述方法包括:
[0032]获取用户反馈的文本数据;
[0033]将所述文本数据输入到预先利用上述所述的客诉识别模型构建方法所得到的客诉识别模型中进行计算,得到所述文本数据对应的客诉识别结果。
[0034]另一方面,本专利技术实施例还提供了一种客诉识别模型的构建装置,所述装置包括:
[0035]样本集归一化处理单元,用于将预先标注的客诉样本集和非客诉样本集经过层归一化处理,得到训练数据集;
[0036]双层双向LSTM网络训练单元,用于将所述训练数据集输入到双层双向LSTM网络进行训练,得到所述训练数据集中每个样本的输出;
[0037]第一向量构建单元,用于将所述训练数据集中每个样本最后一个字符的隐藏层输出组成第一向量;
[0038]池化处理单元,用于对所述训练数据集全部样本的输出在列维度上分别进行最大池化操作和平均池化操作,得到第二向量和第三向量;
[0039]全连接层训练单元,用于对所述第一向量、第二向量和第三向量输入到全连接层进行训练;
[0040]客诉识别模型确定单元,用于在所述全连接层的输出结果与所述训练数据集中的标注情况之间的匹配度满足要求的情况下,得到客诉识别模型。
[0041]基于同一专利技术构思,本专利技术实施例还提供了一种客诉识别装置,所述装置包括:
[0042]客诉文本获取单元,用于获取用户反馈的文本数据;
[0043]客诉识别单元,用于将所述文本数据输入到预先利用上述所述的客诉识别模型构建方法所得到的客诉识别模型中进行计算,得到所述文本数据对应的客诉识别结果。
[0044]另一方面,本专利技术实施例还提供了一种计算机设备,包括存储器、处理器、以及存储在存储器上的计算机程序,处理器执行所述计算机程序时实现上述的方法。
[0045]另一方面,本专利技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法。
[0046]最后,本专利技术实施例还提供了一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述的方法。
[0047]利用本文实施例,首先对多个用户反馈的历史文本进行标注,确定每个文本是否为客诉的标签,分别得到客诉样本集合非客诉样本集,再对客诉样本集和非客诉样本集进行层归一化处理,得到训练数据集,然后将训练数据集输入到双层双向LSTM网络进行训练,得到每个样本的输出。由于双向双层LSTM网络是循环神经网络,每个样本最后一个字符的隐藏层输出包含了前面字符的上下文语义信息,将每个样本的最后一个字符的隐藏层数据组成第一向量。然后对训练数据集全部样本的输出在列维度上分别进行最大池化操作和平均池化操作,得到第二向量和第三向量。再把第二向量和第三向量进行合并,将合并后的向量输入到全连接层进行训练,全连接层的输出为每个样本是否为客诉的结果,然后和各样本标注本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种客诉识别模型的构建方法,其特征在于,所述方法包括:将预先标注的客诉样本集和非客诉样本集经过层归一化处理,得到训练数据集;将所述训练数据集输入到双层双向LSTM网络进行训练,得到所述训练数据集中每个样本的输出;将所述训练数据集中每个样本最后一个字符的隐藏层输出组成第一向量;对所述训练数据集全部样本的输出在列维度上分别进行最大池化操作和平均池化操作,得到第二向量和第三向量;对所述第一向量、第二向量和第三向量输入到全连接层进行训练;在所述全连接层的输出结果与所述训练数据集中的标注情况之间的匹配度满足要求的情况下,得到客诉识别模型。2.根据权利要求1所述的方法,其特征在于,将所述训练数据集输入到双层双向LSTM网络进行训练之前,所述方法还包括:对所述训练数据集进行数据清洗。3.根据权利要求2所述的方法,其特征在于,所述数据清洗包括:对超过所述双层双向LSTM网络输入的最大文本长度的样本进行截断处理,以便于对截断处理后的所述训练数据集输入到双层双向LSTM网络进行训练。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:对文本长度小于所述最大文本长度的样本,按照所述最大文本长度对所述样本的内容进行填充;对填充的内容进行屏蔽处理,以便于将屏蔽处理后的所述训练数据集输入到双层双向LSTM网络进行训练。5.根据权利要求4所述的方法,其特征在于,按照所述最大文本长度对所述样本的内容进行填充进一步包括:在所述样本的内容最后连续填充多个预定字符,直至填充预定字符后的样本的文本长度等于所述最大文本长度。6.根据权利要求4所述的方法,其特征在于,对填充的内容进行屏蔽处理进一步包括:对填充的内容进行标记,以便于在双层双向LSTM神经网络的训练过程中,根据所述标记确定不参加计算的所述填充的内容。7.根据权利要求2所述的方法,其特征在于,所述数据清洗还包括:对所述训练数据集进行脱敏处理,以便于对脱敏处理后的所述训练数据集输入到双层双向LSTM网络进行训练。8.根据权利要求1所述的方法,其特征在于,所述方法还包括:每对所述训练数据集中的全部样本进行一次训练后,根据所述全连接层的输出结果和所述训练数据集中的标注情况计算客诉识别模型正确率;在所述正确率超过预设门限值且大于前后预定次训练对应的正确率时,将该正...

【专利技术属性】
技术研发人员:陈春荣罗晋
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1