本实施例提供一种基于文本的情感分类方法和装置、计算机设备、存储介质,属于人工智能技术领域。该基于文本的情感分类方法包括:获取待分类的原始文本数据,对原始文本数据进行分词处理,得到多个分词文本数据;对分词文本数据进行数据增强处理,得到分词文本数据对应的情感正例对;通过预先训练的对比学习模型对情感正例对进行对比学习,得到包含情感特征的情感嵌入向量;之后根据情感嵌入向量进行情感分类处理,得到对应情感特征的目标情感类别。通过结合对比学习模型对情感正例对进行对比学习,得到情感嵌入向量之后再进行情感分类处理,能够解决训练数据分布不均衡的问题,从而提高情感分类的准确率。提高情感分类的准确率。提高情感分类的准确率。
【技术实现步骤摘要】
基于文本的情感分类方法和装置、计算机设备、存储介质
[0001]本申请涉及人工智能
,尤其涉及一种基于文本的情感分类方法和装置、计算机设备、存储介质。
技术介绍
[0002]随着计算机技术的发展,许多业务需要使用计算机技术进行自然语言处理。其中,情感分析是一种常见的自然语言处理方法的应用。目前,通常利用循环神经网络RNN或者BERT模型来进行文本情感分类,由于这两种模型在训练过程的不同种类的训练数据分布不均衡,从而影响情感分类的准确率。因此,如何提供一种文本的情感分类方法,来提高文本情感分类的准确率,成为了亟待解决的技术问题。
技术实现思路
[0003]本申请实施例的主要目的在于提出一种基于文本的情感分类方法和装置、计算机设备、存储介质,旨在提高文本情感分类的准确率。
[0004]为实现上述目的,本申请实施例的第一方面提出了一种基于文本的情感分类方法,包括:
[0005]获取待分类的原始文本数据;
[0006]对所述原始文本数据进行分词处理,得到分词文本数据;其中,所述分词文本数据包括用于表征情感类别的情感特征;
[0007]对所述分词文本数据进行数据增强处理,得到所述分词文本数据对应的情感正例对;其中,每一所述情感正例对包括所述情感特征;
[0008]通过预先训练的对比学习模型对所述情感正例对进行对比学习,得到情感嵌入向量;
[0009]根据所述情感嵌入向量进行情感分类处理,得到对应所述情感特征的目标情感类别。
[0010]在一些实施例,所述对所述分词文本数据进行数据增强处理,得到所述分词文本数据对应的情感正例对,包括:
[0011]对所述分词文本数据进行复制,得到复制文本数据;
[0012]对所述分词文本数据进行第一数据增强处理,得到第一编码向量;
[0013]对所述复制文本数据进行第二数据增强处理,得到第二编码向量;
[0014]根据所述第一编码向量和所述第二编码向量,得到所述情感正例对。
[0015]在一些实施例,所述根据所述第一编码向量和所述第二编码向量,得到所述情感正例对,包括:
[0016]通过第一多层感知机对所述第一编码向量进行映射处理,得到第一映射数据;
[0017]通过第二多层感知机对所述第二编码向量进行映射处理,得到第二映射数据;
[0018]根据所述第一映射数据和所述第二映射数据构建所述情感正例对。
[0019]在一些实施例,在所述通过预先训练的对比学习模型对所述情感正例对进行对比学习,得到情感嵌入向量之前,所述方法还包括:构建所述对比学习模型,具体包括:
[0020]获取训练样本;所述训练样本包括样本正例对和样本负例对;
[0021]将所述样本正例对和所述样本负例对输入到原始学习模型;
[0022]根据所述样本正例对和所述样本负例对,对所述原始学习模型的损失函数进行计算,得到损失值;
[0023]根据所述损失值更新所述原始学习模型,得到所述对比学习模型。
[0024]在一些实施例,所述根据所述损失值更新所述原始学习模型,得到所述对比学习模型,包括:
[0025]将所述损失值作为反向传播量,调整所述原始学习模型的模型参数,以更新所述原始学习模型,得到所述对比学习模型。
[0026]在一些实施例,所述根据所述情感嵌入向量进行情感分类处理,得到对应所述情感特征的目标情感类别,包括:
[0027]获取预设的神经网络模型;其中,所述神经网络模型包括卷积层、池化层、全连接层和分类器;
[0028]通过所述卷积层对所述情感嵌入向量进行特征提取处理,得到多个卷积特征向量;
[0029]通过所述池化层对每一所述卷积特征向量进行最大池化处理,得到多个池化特征向量;
[0030]通过所述全连接层对多个所述池化特征向量进行拼接处理,得到拼接特征向量;
[0031]通过所述分类器对所述拼接特征向量进行分类处理,得到对应所述情感特征的目标情感类别。
[0032]在一些实施例,所述通过所述分类器对所述拼接特征向量进行分类处理,得到对应所述情感特征的目标情感类别,包括:
[0033]通过所述分类器对所述拼接特征向量进行分类处理,得到多个候选情感类别以及每一所述候选情感类别对应的情感概率值;
[0034]获取情感概率值最高的候选情感类别,作为所述目标情感类别。
[0035]本公开实施例的第二方面提出了一种基于文本的情感分类装置,包括:
[0036]获取模块:用于获取待分类的原始文本数据;
[0037]分词模块:用于对所述原始文本数据进行分词处理,得到分词文本数据;其中,所述分词文本数据包括用于表征情感类别的情感特征;
[0038]增强模块:用于对所述分词文本数据进行数据增强处理,得到所述分词文本数据对应的情感正例对;其中,每一所述情感正例对包括所述情感特征;
[0039]学习模块:用于通过预先训练的对比学习模型对所述情感正例对进行对比学习,得到情感嵌入向量;
[0040]分类模块:用于根据所述情感嵌入向量进行情感分类处理,得到对应所述情感特征的目标情感类别。
[0041]本公开实施例的第三方面提出了一种计算机设备,所述计算机设备包括存储器和处理器,其中,所述存储器中存储有程序,所述程序被所述处理器执行时所述处理器用于执
行如本申请第一方面实施例任一项所述的方法。
[0042]本公开实施例的第四方面提出了一种存储介质,该存储介质为计算机可读存储介质,所述存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如本申请第一方面实施例任一项所述的方法。
[0043]本公开实施例提出的基于文本的情感分类方法和装置、计算机设备、存储介质,通过获取待分类的原始文本数据,对原始文本数据进行分词处理,得到多个分词文本数据,其中分词文本数据包括用于表征情感类别的情感特征;对分词文本数据进行数据增强处理,得到分词文本数据对应的情感正例对,其中每一情感正例对同样包括情感特征;通过预先训练的对比学习模型对情感正例对进行对比学习,得到包含情感特征的情感嵌入向量;之后根据情感嵌入向量进行情感分类处理,得到对应情感特征的目标情感类别。本申请实施例通过结合对比学习模型对情感正例对进行对比学习,得到情感嵌入向量之后再进行情感分类处理,能够解决训练数据分布不均衡的问题,从而提高情感分类的准确率。
附图说明
[0044]图1是本公开实施例提供的基于文本的情感分类方法的第一流程图;
[0045]图2是图1中的步骤S300的流程图;
[0046]图3是图2中的步骤S340的流程图;
[0047]图4是本公开实施例提供的基于文本的情感分类方法的第二流程图;
[0048]图5是图1中的步骤S500的流程图;
[0049]图6是图5中的步骤S550的流程图;
[0050]图7是本公开实本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于文本的情感分类方法,其特征在于,包括:获取待分类的原始文本数据;对所述原始文本数据进行分词处理,得到分词文本数据;其中,所述分词文本数据包括用于表征情感类别的情感特征;对所述分词文本数据进行数据增强处理,得到所述分词文本数据对应的情感正例对;其中,每一所述情感正例对包括所述情感特征;通过预先训练的对比学习模型对所述情感正例对进行对比学习,得到情感嵌入向量;根据所述情感嵌入向量进行情感分类处理,得到对应所述情感特征的目标情感类别。2.根据权利要求1所述的方法,其特征在于,所述对所述分词文本数据进行数据增强处理,得到所述分词文本数据对应的情感正例对,包括:对所述分词文本数据进行复制,得到复制文本数据;对所述分词文本数据进行第一数据增强处理,得到第一编码向量;对所述复制文本数据进行第二数据增强处理,得到第二编码向量;根据所述第一编码向量和所述第二编码向量,得到所述情感正例对。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一编码向量和所述第二编码向量,得到所述情感正例对,包括:通过第一多层感知机对所述第一编码向量进行映射处理,得到第一映射数据;通过第二多层感知机对所述第二编码向量进行映射处理,得到第二映射数据;根据所述第一映射数据和所述第二映射数据构建所述情感正例对。4.根据权利要求1所述的方法,其特征在于,在所述通过预先训练的对比学习模型对所述情感正例对进行对比学习,得到情感嵌入向量之前,所述方法还包括:构建所述对比学习模型,具体包括:获取训练样本;所述训练样本包括样本正例对和样本负例对;将所述样本正例对和所述样本负例对输入到原始学习模型;根据所述样本正例对和所述样本负例对,对所述原始学习模型的损失函数进行计算,得到损失值;根据所述损失值更新所述原始学习模型,得到所述对比学习模型。5.根据权利要求4所述的方法,其特征在于,所述根据所述损失值更新所述原始学习模型,得到所述对比学习模型,包括:将所述损失值作为反向传播量,调整所述原始学习模型的模型参数,以更新所述原始学习模型,得到所述对比学...
【专利技术属性】
技术研发人员:舒畅,陈又新,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。