基于文本的情感分类方法和装置、计算机设备、存储介质制造方法及图纸

技术编号：33134875 阅读：23 留言：0更新日期：2022-04-17 00:58

本实施例提供一种基于文本的情感分类方法和装置、计算机设备、存储介质，属于人工智能技术领域。该基于文本的情感分类方法包括：获取待分类的原始文本数据，对原始文本数据进行分词处理，得到多个分词文本数据；对分词文本数据进行数据增强处理，得到分词文本数据对应的情感正例对；通过预先训练的对比学习模型对情感正例对进行对比学习，得到包含情感特征的情感嵌入向量；之后根据情感嵌入向量进行情感分类处理，得到对应情感特征的目标情感类别。通过结合对比学习模型对情感正例对进行对比学习，得到情感嵌入向量之后再进行情感分类处理，能够解决训练数据分布不均衡的问题，从而提高情感分类的准确率。提高情感分类的准确率。提高情感分类的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
基于文本的情感分类方法和装置、计算机设备、存储介质

[0001]本申请涉及人工智能
，尤其涉及一种基于文本的情感分类方法和装置、计算机设备、存储介质。

技术介绍

[0002]随着计算机技术的发展，许多业务需要使用计算机技术进行自然语言处理。其中，情感分析是一种常见的自然语言处理方法的应用。目前，通常利用循环神经网络RNN或者BERT模型来进行文本情感分类，由于这两种模型在训练过程的不同种类的训练数据分布不均衡，从而影响情感分类的准确率。因此，如何提供一种文本的情感分类方法，来提高文本情感分类的准确率，成为了亟待解决的技术问题。

技术实现思路

[0003]本申请实施例的主要目的在于提出一种基于文本的情感分类方法和装置、计算机设备、存储介质，旨在提高文本情感分类的准确率。
[0004]为实现上述目的，本申请实施例的第一方面提出了一种基于文本的情感分类方法，包括：
[0005]获取待分类的原始文本数据；
[0006]对所述原始文本数据进行分词处理，得到分词文本数据；其中，所述分词文本数...

【技术保护点】

【技术特征摘要】
1.一种基于文本的情感分类方法，其特征在于，包括：获取待分类的原始文本数据；对所述原始文本数据进行分词处理，得到分词文本数据；其中，所述分词文本数据包括用于表征情感类别的情感特征；对所述分词文本数据进行数据增强处理，得到所述分词文本数据对应的情感正例对；其中，每一所述情感正例对包括所述情感特征；通过预先训练的对比学习模型对所述情感正例对进行对比学习，得到情感嵌入向量；根据所述情感嵌入向量进行情感分类处理，得到对应所述情感特征的目标情感类别。2.根据权利要求1所述的方法，其特征在于，所述对所述分词文本数据进行数据增强处理，得到所述分词文本数据对应的情感正例对，包括：对所述分词文本数据进行复制，得到复制文本数据；对所述分词文本数据进行第一数据增强处理，得到第一编码向量；对所述复制文本数据进行第二数据增强处理，得到第二编码向量；根据所述第一编码向量和所述第二编码向量，得到所述情感正例对。3.根据权利要求2所述的方法，其特征在于，所述根据所述第一编码向量和所述第二编码向量，得到所述情感正例对，包括：通过第一多层感知机对所述第一编码向量进行映射处理，得到第一映射数据；通过第二多层感知机对所述第二编码向量进行映射处理，得到第二映射数据；根据所述第一映射数据和所述第二映射数据构建所述情感正例对。4.根据权利要求1所述的方法，其特征在于，在所述通过预先训练的对比学习模型对所述情感正例对进行对比学习，得到情感嵌入向量之前，所述方法还包括：构建所述对比学习模型，具体包括：获取训练样本；所述训练样本包括样本正例对和样本负例对；将所述样本正例对和所述样本负例对输入到原始学习模型；根据所述样本正例对和所述样本负例对，对所述原始学习模型的损失函数进行计算，得到损失值；根据所述损失值更新所述原始学习模型，得到所述对比学习模型。5.根据权利要求4所述的方法，其特征在于，所述根据所述损失值更新所述原始学习模型，得到所述对比学习模型，包括：将所述损失值作为反向传播量，调整所述原始学习模型的模型参数，以更新所述原始学习模型，得到所述对比学...

【专利技术属性】
技术研发人员：舒畅，陈又新，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人