System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及人工智能,尤其涉及一种情感分类模型训练方法、系统、情感分类方法及系统。
技术介绍
1、在当今的信息社会中,评论信息情感分类具有重要的意义。例如:对主贴的评论信息进行情感分类,以了解评论者的情感等。通过对评论信息进行情感分类,能够帮助企业或机构等进行用户情感分析与舆论监控等。目前,通常通过对评论信息进行分词,并利用神经网络模型对分词后的多个词汇进行情感分类。
2、然而,上述方式在处理多样化情感数据的分类时,分类效果较差,精准度较低。并且,对于评论信息较短且模棱两可的情况,该方式难以准确判断其情感倾向。
技术实现思路
1、本申请提供一种情感分类模型训练方法、系统、情感分类方法及系统,以解决现有技术中在对评论信息进行情感分类时,分类效果较差,精准度较低的问题。
2、本申请提供的情感分类模型训练方法,所述方法包括:获取训练集,所述训练集包括多个训练样本,所述训练样本包括:评论信息、被评论信息以及情感标签;
3、对所述评论信息与所述被评论信息进行拼接,基于拼接后的信息进行特征提取,得到目标特征;
4、利用预设的嵌入层,将所述情感标签转换为嵌入向量;
5、对所述目标特征与对应的所述嵌入向量进行拼接,得到综合向量;
6、将所述综合向量输入情感分类模型的分类网络,以完成情感分类模型训练。
7、于本申请一实施例中,基于拼接后的信息进行特征提取,得到目标特征的步骤包括:
8、将拼接后的信息确定为原
9、对所述目标文本中的所述评论信息和所述被评论信息分别进行分词,得到多个词汇单元;
10、将全部所述词汇单元输入预设的bert模型,进行信息编码,以得到每个所述词汇单元的向量表示,所述向量表示的维度高于所述词汇单元的维度;
11、对全部所述词汇单元的所述向量表示进行拼接,得到目标序列;
12、基于所述目标序列进行特征提取,得到所述目标特征。
13、于本申请一实施例中,基于所述目标序列进行特征提取,得到所述目标特征的步骤包括:
14、将所述目标序列输入所述情感分类模型的长短期记忆网络,进行语义特征提取,得到多个目标语义特征,所述目标语义特征与所述词汇单元的所述向量表示一一对应;
15、根据预设的段长度,对全部所述目标语义特征进行分段,得到若干个特征段,所述特征段包括固定数量的所述目标语义特征;
16、对所述特征段中的全部所述目标语义特征分别进行线性变换,得到若干个第一key向量,所述第一key向量与所述目标语义特征一一对应;
17、将所述第一key向量与预设的第一query向量之间的点积确定为第一注意力权重;
18、对全部所述第一注意力权重进行归一化处理,得到第一目标权重;
19、基于所述特征段内每个所述目标语义特征所对应的第一目标权重,对所述特征段内的每个所述目标语义特征进行加权求和,以得到每个所述特征段的目标表示;
20、基于每个所述特征段的目标表示,进行特征提取,得到所述目标特征。
21、于本申请一实施例中,基于每个所述特征段的目标表示,进行特征提取,得到所述目标特征的步骤包括:
22、对每个所述特征段的目标表示分别进行线性变换,得到若干个第二key向量,所述第二key向量与所述特征段一一对应;
23、将所述第二key向量与预设的第二query向量之间的点积确定为第二注意力权重;
24、对全部所述第二注意力权重进行归一化处理,得到第二目标权重;
25、基于每个所述特征段对应的所述第二目标权重,对全部所述特征段的所述目标表示进行加权求和,得到当前所述目标序列的最终表示;将所述最终表示确定为所述目标特征。
26、于本申请一实施例中,将所述综合向量输入情感分类模型的分类网络,以完成情感分类模型训练的步骤包括:
27、将所述综合向量输入所述分类网络中的全连接子网络,进行线性变换与激活,得到预设维度的特征表示,所述全连接子网络包括至少一个全连接单元,所述全连接单元包括中间全连接层及非线性激活函数层;
28、将所述特征表示输入所述分类网络中的输出子网络,进行线性变换与激活,以得到情感分类结果,所述输出子网络包括:最终全连接层与softmax激活函数层;
29、基于所述情感分类结果,对所述情感分类模型进行训练。
30、于本申请一实施例中,将所述综合向量输入所述分类网络中的全连接子网络,进行线性变换与激活,得到预设维度的特征表示的步骤包括:
31、将所述综合向量输入所述全连接子网络的第一全连接单元,进行线性变换与激活,得到中间特征向量;
32、将所述中间特征向量输入所述全连接子网络的第二全连接单元,进行线性变换与激活,得到预设维度的所述特征表示,所述综合向量的维度大于所述中间特征向量的维度,所述中间特征向量的维度大于所述特征表示的维度。
33、本申请还提供一种情感分类模型训练系统,包括:
34、训练集获取模块,用于获取训练集,所述训练集包括多个训练样本,所述训练样本包括:评论信息、被评论信息以及情感标签;
35、处理模块,用于对所述评论信息与所述被评论信息进行拼接,基于拼接后的信息进行特征提取,得到目标特征;
36、嵌入模块,用于利用预设的嵌入层,将所述情感标签转换为嵌入向量;
37、拼接模块,用于对所述目标特征与对应的所述嵌入向量进行拼接,得到综合向量;
38、训练模块,用于将所述综合向量输入情感分类模型的分类网络,以完成情感分类模型训练。
39、本申请还提供一种评论信息情感分类方法,包括:
40、获取待分类文本,所述待分类文本包括待分类评论信息和待分类被评论信息;
41、对所述待分类评论信息与所述待分类被评论信息进行拼接,得到拼接信息;
42、基于所述拼接信息及训练好的情感分类模型,进行情感分类,得到所述待分类评论信息的情感类别,训练好的所述情感分类模型采用如上述任一项所述的情感分类模型训练方法训练得到。
43、于本申请一实施例中,基于所述拼接信息及训练好的情感分类模型,进行情感分类,得到所述待分类评论信息的情感类别的步骤包括:
44、对所述拼接信息进行清洗,得到清洗文本;
45、对所述清洗文本中的所述待分类评论信息和所述待分类被评论信息分别进行分词,得到多个目标词汇单元;
46、将全部所述目标词汇单元输入预设的bert模型,进行信息编码,以得到每个所述目标词汇单元的目标向量表示,所述目标向量表示的维度高于所述目标词汇单元的维度;
47、对全部所述目标向量表示进行拼接,得到拼接序列;
48、将所述拼接序列输入训练好的所述情感分本文档来自技高网...
【技术保护点】
1.一种情感分类模型训练方法,其特征在于,包括:
2.根据权利要求1所述的情感分类模型训练方法,其特征在于,基于拼接后的信息进行特征提取,得到目标特征的步骤包括:
3.根据权利要求2所述的情感分类模型训练方法,其特征在于,基于所述目标序列进行特征提取,得到所述目标特征的步骤包括:
4.根据权利要求3所述的情感分类模型训练方法,其特征在于,基于每个所述特征段的目标表示,进行特征提取,得到所述目标特征的步骤包括:
5.根据权利要求1至4任一项所述的情感分类模型训练方法,其特征在于,将所述综合向量输入情感分类模型的分类网络,以完成情感分类模型训练的步骤包括:
6.根据权利要求5所述的情感分类模型训练方法,其特征在于,将所述综合向量输入所述分类网络中的全连接子网络,进行线性变换与激活,得到预设维度的特征表示的步骤包括:
7.一种情感分类模型训练系统,其特征在于,包括:
8.一种评论信息情感分类方法,其特征在于,包括:
9.根据权利要求8所述的评论信息情感分类方法,其特征在于,基于所述拼接信息及
10.一种评论信息情感分类系统,其特征在于,包括:
...【技术特征摘要】
1.一种情感分类模型训练方法,其特征在于,包括:
2.根据权利要求1所述的情感分类模型训练方法,其特征在于,基于拼接后的信息进行特征提取,得到目标特征的步骤包括:
3.根据权利要求2所述的情感分类模型训练方法,其特征在于,基于所述目标序列进行特征提取,得到所述目标特征的步骤包括:
4.根据权利要求3所述的情感分类模型训练方法,其特征在于,基于每个所述特征段的目标表示,进行特征提取,得到所述目标特征的步骤包括:
5.根据权利要求1至4任一项所述的情感分类模型训练方法,其特征在于,将所述综合向量输入情感分类模型的分类网络...
【专利技术属性】
技术研发人员:曾玉兴,朱红霞,罗俊,周沁含,谭昙,罗顺桥,黄勇,明双,庞景景,
申请(专利权)人:赛力斯汽车有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。