System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及人工智能领域,尤其涉及一种保险文本分类方法、装置、设备及介质。
技术介绍
1、文本分类是指基于预定的规则将文本进行分门别类。例如,在金融领域中,保险文本的归纳整合能够通过深度学习技术对保险文本进行分门别类。传统的保险文本分类方法是通过人工根据自身经验进行保险文本的分类。
2、但是,这种方法由于保险文本涉及的保障场景丰富,受众客户信息庞大,在保险文本分类中,通过人工基于自身经验进行录入分类时,一旦录入的保险类别出问题需要重新进行修改,使得保险文本分类耗时耗力且准确性难以保障,导致保险文本分类的效率及准确性较低。
技术实现思路
1、本申请实施例的目的在于提出一种保险文本分类方法、装置、设备及介质,其主要目的是提高保险文本分类的效率及准确率。
2、为了解决上述技术问题,本申请实施例提供一种保险文本分类方法,采用了如下所述的技术方案:
3、获取待分类的保险文本集,利用训练完成的实体识别模型对所述保险文本集进行实体识别,得到文本实体集;
4、对所述文本实体集进行数据增强操作,得到增强文本集;
5、利用训练完成的文本分类模型中的编码层提取所述增强文本集的特征,得到增强文本特征集;
6、利用所述文本分类模型中的双向循环层提取所述增强文本特征集的上下文特征,得到上下文特征集;
7、利用所述文本分类模型中的多头注意力机制层计算所述上下文特征集的注意力权重值;
8、将所述注意力权重值输入所述文本分
9、进一步的,所述利用所述文本分类模型中的双向循环层提取所述增强文本特征集的上下文特征,得到上下文特征集,包括:
10、将所述增强文本特征集输入所述双向循环层中的输入门及遗忘门中,得到文本状态值;
11、利用所述双向循环层中的前向输出门计算所述文本状态值对应的前向上下文特征集;
12、利用所述双向循环层中的后向输出门计算所述文本状态值对应的后向上下文特征集;
13、将所述前向上下文特征集与所述后向上下文特征集进行拼接,得到所述上下文特征集。
14、进一步的,所述利用训练完成的实体识别模型对所述保险文本集进行实体识别,得到文本实体集,包括:
15、利用所述实体识别模型中的特征层提取所述保险文本集的特征,得到文本特征集;
16、利用所述实体识别模型中的循环层对所述文本特征集中的每个单词进行实体识别,得到待预测实体标签;
17、利用所述实体识别模型中的实体层对所述待预测实体标签进行标注,得到所述文本实体集。
18、进一步的,所述利用所述实体识别模型中的实体层对所述待预测实体标签进行标注,得到所述文本实体集,包括:
19、利用所述实体层获取所述待预测实体标签的分数矩阵及转移特征矩阵;
20、对所述待预测实体标签、所述分数矩阵及所述特征转移矩阵进行计算,得到待预测实体标签中对应的实体分数,并将实体分数中最高的实体分数对应的实体标签整合作为所述文本实体集。
21、进一步的,所述利用所述文本分类模型中的多头注意力机制层计算所述上下文特征集的注意力权重值,包括:
22、利用所述多头注意力机制层对所述上下文特征集进行注意力权重计算,得到多个权重值;
23、对多个权重值进行加权运算,得到所述注意力权重值。
24、进一步的,所述利用训练完成的文本分类模型中的编码层提取所述增强文本集的特征,得到增强文本特征集,包括:
25、利用所述编码层对所述增强文本集进行编码,得到词向量特征集;
26、对所述词向量特征集进行加权池化,得到动态词向量特征集;
27、对所述动态词向量特征集进行平均池化,得到增强文本特征集。
28、进一步的,所述对所述文本实体集进行数据增强操作,得到增强文本集,包括:
29、对所述文本实体集中的地点实体与场景实体进行同类实体替换,得到第一增强文本集;
30、利用预设的词典对所述文本实体集进行实体扩充,得到第二增强文本集;
31、合并所述第一增强文本集及第二增强文本集,得到所述增强文本集。
32、为了解决上述技术问题,本申请实施例还提供一种保险文本分类装置,采用了如下所述的技术方案:
33、识别模块,用于获取待分类的保险文本集,利用训练完成的实体识别模型对所述保险文本集进行实体识别,得到文本实体集;
34、增强模块,用于对所述文本实体集进行数据增强操作,得到增强文本集;
35、第一提取模块,用于利用训练完成的文本分类模型中的编码层提取所述增强文本集的特征,得到增强文本特征集;
36、第二提取模块,用于利用所述文本分类模型中的双向循环层提取所述增强文本特征集的上下文特征,得到上下文特征集;
37、计算模块,用于利用所述文本分类模型中的多头注意力机制层计算所述上下文特征集的注意力权重值;及
38、分类模块,用于将所述注意力权重值输入所述文本分类模型中的全连接层中,得到所述保险文本集的保险分类类别。
39、为了解决上述技术问题,本申请实施例还提供一种设备,采用了如下所述的技术方案:
40、存储器,存储至少一个计算机程序;及
41、处理器,执行所述存储器中存储的计算机程序以实现上述所述的保险文本分类方法。
42、为了解决上述技术问题,本申请实施例还提供一种计算机可读介质,采用了如下所述的技术方案:
43、所述计算机可读介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的保险文本分类方法。
44、与现有技术相比,本申请实施例主要有以下有益效果:
45、本申请实施例中,首先通过利用实体识别模型对保险文本集进行实体识别,得到文本实体集,并对文本实体集进行数据增强操作,能够扩充保险文本集的文本内容,便于提高后续文本分类的准确性;其次,通过利用训练完成的文本分类模型中的编码层提取增强文本集的特征,能够实现准确的提取保险文本的特征,并通过利用双向循环层提取增强文本特征集的上下文特征,得到上下文特征集,能够精准捕捉保险文本之间的上下文特征,便于提高后续文本分类的准确性;最后,通过利用多头注意力机制层计算上下文特征集的注意力权重值,并将注意力权重值输入文本分类模型中,得到保险文本集的保险分类类别,能够实现保险文本的自动分类,无需通过人工进行保险类别录入,提高了保险文本分类的效率及准确性。因此本申请提出的保险文本分类方法、装置、设备及介质可以提高保险文本分类的效率及准确率。
本文档来自技高网...【技术保护点】
1.一种保险文本分类方法,其特征在于,包括下述步骤:
2.根据权利要求1所述的保险文本分类方法,其特征在于,所述利用所述文本分类模型中的双向循环层提取所述增强文本特征集的上下文特征,得到上下文特征集,包括:
3.根据权利要求1所述的保险文本分类方法,其特征在于,所述利用训练完成的实体识别模型对所述保险文本集进行实体识别,得到文本实体集,包括:
4.根据权利要求3所述的保险文本分类方法,其特征在于,所述利用所述实体识别模型中的实体层对所述待预测实体标签进行标注,得到所述文本实体集,包括:
5.根据权利要求1-4中任一项所述的保险文本分类方法,其特征在于,所述利用所述文本分类模型中的多头注意力机制层计算所述上下文特征集的注意力权重值,包括:
6.根据权利要求1-4中任一项所述的保险文本分类方法,其特征在于,所述利用训练完成的文本分类模型中的编码层提取所述增强文本集的特征,得到增强文本特征集,包括:
7.根据权利要求1-4中任一项所述的保险文本分类方法,其特征在于,所述对所述文本实体集进行数据增强操作,得到增强文本
8.一种保险文本分类装置,其特征在于,包括:
9.一种设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述的保险文本分类方法的步骤。
10.一种计算机可读介质,其特征在于,所述计算机可读介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至7中任一项所述的保险文本分类方法的步骤。
...【技术特征摘要】
1.一种保险文本分类方法,其特征在于,包括下述步骤:
2.根据权利要求1所述的保险文本分类方法,其特征在于,所述利用所述文本分类模型中的双向循环层提取所述增强文本特征集的上下文特征,得到上下文特征集,包括:
3.根据权利要求1所述的保险文本分类方法,其特征在于,所述利用训练完成的实体识别模型对所述保险文本集进行实体识别,得到文本实体集,包括:
4.根据权利要求3所述的保险文本分类方法,其特征在于,所述利用所述实体识别模型中的实体层对所述待预测实体标签进行标注,得到所述文本实体集,包括:
5.根据权利要求1-4中任一项所述的保险文本分类方法,其特征在于,所述利用所述文本分类模型中的多头注意力机制层计算所述上下文特征集的注意力权重值,包括:
6....
【专利技术属性】
技术研发人员:陈潮城,
申请(专利权)人:中国平安财产保险股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。