文本情感识别方法、装置、计算机设备及可读存储介质制造方法及图纸

技术编号：37557527 阅读：12 留言：0更新日期：2023-05-15 07:40

本申请涉及一种文本情感识别方法、装置、计算机设备及可读存储介质。所述方法包括：获取待识别文本和文本语料集，其中，所述文本语料集包括多个文本语句和与所述多个文本语句匹配的多个表情标签；确定所述待识别文本的表征向量与每个所述文本语句的表征向量的相似度值，并基于所述相似度值和所述多个表情标签确定所述待识别文本的表情特征向量；获取所述待识别文本的语义特征向量，并基于所述语义特征向量和所述表情特征向量确定所述待识别文本的情感类型。本申请提供的文本情感识别方法将表情特征向量作为辅助识别情感的工具，可以有效提高文本情感识别结果的准确度。有效提高文本情感识别结果的准确度。有效提高文本情感识别结果的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
文本情感识别方法、装置、计算机设备及可读存储介质

[0001]本申请涉及文本识别
，特别是涉及一种文本情感识别方法、装置、计算机设备及可读存储介质。

技术介绍

[0002]文本情感识别作为人工智能领域的重要研究方向，有着重大的应用价值及广泛的应用场景，例如智慧客服、智慧教育、心理疏导、舆情监控等。通过赋予机器识别人类情感的能力，可使得机器能更好地对人类活动进行理解及反馈。
[0003]在相关技术中，文本情感识别方法大多基于深度神经网络方法，其主要利用深度神经网络的特征学习能力，从输入的文本数据中学习到与情感分类相关的特征，以避免传统机器学习方法中繁琐的人工特征设计流程。然而相关技术中的文本识别方法很大程度上依赖文本的标注数据，在标注数据类型难以准确表达文本情感或标注数据数量不足的情况下，文本情感识别结果的准确度相对较低。

技术实现思路

[0004]基于此，有必要针对上述技术问题，提供一种能够提高文本情感识别准确度的文本情感识别方法、装置、计算机设备及可读存储介质。
[0005]第一方面，本申请提供了一种文本情感识别方法。所述方法包括：获取待识别文本和文本语料集，其中，所述文本语料集包括多个文本语句和与所述多个文本语句匹配的多个表情标签；确定所述待识别文本的表征向量与每个所述文本语句的表征向量的相似度值，并基于所述相似度值和所述多个表情标签确定所述待识别文本的表情特征向量；获取所述待识别文本的语义特征向量，并基于所述语义特征向量和所述表情特征向量确定所述待识别文本的情感类型。/>[0006]在其中一个实施例中，所述确定所述待识别文本的表征向量与每个所述文本语句的表征向量的相似度值包括：分别将所述待识别文本和所述多个文本语句输入至语句相似度匹配模型中，输出所述待识别文本的表征向量和每个所述文本语句的表征向量；确定所述待识别文本的表征向量与每个所述文本语句的表征向量的余弦相似度值作为所述相似度值。
[0007]在其中一个实施例中，在分别将所述待识别文本和所述多个文本语句输入至语句相似度匹配模型中之前，所述方法还包括：获取开放域文本样本数据，并基于所述文本样本数据训练得到初始语句相似度对比模型；基于所述文本语料集、第一目标损失函数和第二目标损失函数训练所述初始语句相似度对比模型得到所述语句相似度匹配模型，其中，所述第一目标损失函数为基于所述
多个表情标签确定的有监督对比学习目标函数，所述第二目标损失函数为无监督对比学习目标函数。
[0008]在其中一个实施例中，所述基于所述文本语料集、第一目标损失函数和第二目标损失函数训练所述初始语句相似度对比模型得到所述语句相似度匹配模型包括：基于预设权重系数确定所述第一目标损失函数和第二目标损失函数的加权和作为第三目标损失函数；基于所述文本语料集、第三目标损失函数训练所述初始语句相似度对比模型，得到训练完备的所述语句相似度匹配模型。
[0009]在其中一个实施例中，在所述基于所述文本语料集、第一目标损失函数和第二目标损失函数训练所述初始语句相似度对比模型得到所述语句相似度匹配模型之前，还包括：滤除所述文本语料集中的干扰信息，并确定大于预设字数且仅包含相同类型表情标签的预处理文本语句；拆分所述预处理文本语句，得到相匹配的所述多个文本语句和所述多个表情标签。
[0010]在其中一个实施例中，所述基于所述相似度值和所述多个表情标签确定所述待识别文本的表情特征向量包括：获取所述文本语料集中相似度值最高的预设数量的文本语句，并确定与所述预设数量的文本语句匹配的表情标签的表情嵌入向量；对所述相似度值进行归一化处理，得到加权值，并基于所述加权值和所述表情嵌入向量确定动态表情特征向量，将所述动态表情特征向量作为所述待识别文本的表情特征向量。
[0011]在其中一个实施例中，所述基于所述相似度值和所述多个表情标签确定所述待识别文本的表情特征向量还包括：将与相同类型表情标签匹配的文本语句的表征向量进行加和平均，得到与多个类型表情标签匹配的多个第一静态标签向量；将与所述预设数量的文本语句匹配的表情标签映射至所述多个第一静态标签向量得到第二静态标签向量；基于所述加权值和所述第二静态标签向量确定静态表情特征向量，将所述动态表情特征向量和所述静态表情特征向量作为所述待识别文本的表情特征向量。
[0012]在其中一个实施例中，所述基于所述语义特征向量和所述表情特征向量确定所述待识别文本的情感类型包括：将所述语义特征向量和所述表情特征向量进行特征融合，得到预设情感类型数量的融合特征向量；确定所述融合特征向量属于每种情感类型的概率值，并基于所述概率值确定所述待识别文本的情感类型。
[0013]在其中一个实施例中，所述确定所述融合特征向量属于每种情感类型的概率值，并基于所述概率值确定所述待识别文本的情感类型包括：将所述融合特征向量进行归一化处理，基于归一化处理结果确定所述待识别文本
属于每种情感类型的概率值；将所述概率值最大的情感类型作为待识别文本的情感类型。
[0014]第二方面，本申请还提供了一种文本情感识别装置。所述装置包括：文本获取模块，用于获取待识别文本和文本语料集，其中，所述文本语料集包括多个文本语句和与所述多个文本语句匹配的多个表情标签；表情特征向量确定模块，用于确定所述待识别文本的表征向量与每个所述文本语句的表征向量的相似度值，并基于所述相似度值和所述多个表情标签确定所述待识别文本的表情特征向量；情感类型确定模块，用于获取所述待识别文本的语义特征向量，并基于所述语义特征向量和所述表情特征向量确定所述待识别文本的情感类型。
[0015]第三方面，本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述第一方面中任意一项所述文本情感识别方法的步骤。
[0016]第四方面，本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面中任意一项所述文本情感识别方法的步骤。
[0017]上述文本情感识别方法、装置、计算机设备及可读存储介质，通过获取待识别文本和文本语料集，文本语料集包括多个文本语句和与所述多个文本语句匹配的多个表情标签，确定所述待识别文本的表征向量与每个所述文本语句的表征向量的相似度值，并基于所述相似度值和所述多个表情标签确定所述待识别文本的表情特征向量，再获取所述待识别文本的语义特征向量，并基于所述语义特征向量和所述表情特征向量确定所述待识别文本的情感类型。在文本语料中包含大量的表情符号如颜文字等，这些表情符号与人类情感直接相关且能够准确地表达该文本语料的情感，因此将表情符号作为相应文本语句的表情标注，通过提取、迁移利用表情符号信息可以有效提高文本情感识别的准确度。本申请实施例基于待识别文本与文本语料集中文本语句的相似度、表情标签确定表情特征向量，并基于表情特征向量和语义特征向量综合确定待识别文本的情感类型，在量化语句相似度以及将表情标签作为辅助本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本情感识别方法，其特征在于，所述方法包括：获取待识别文本和文本语料集，其中，所述文本语料集包括多个文本语句和与所述多个文本语句匹配的多个表情标签；确定所述待识别文本的表征向量与每个所述文本语句的表征向量的相似度值，并基于所述相似度值和所述多个表情标签确定所述待识别文本的表情特征向量；获取所述待识别文本的语义特征向量，并基于所述语义特征向量和所述表情特征向量确定所述待识别文本的情感类型。2.根据权利要求1所述的方法，其特征在于，所述确定所述待识别文本的表征向量与每个所述文本语句的表征向量的相似度值包括：分别将所述待识别文本和所述多个文本语句输入至语句相似度匹配模型中，输出所述待识别文本的表征向量和每个所述文本语句的表征向量；确定所述待识别文本的表征向量与每个所述文本语句的表征向量的余弦相似度值作为所述相似度值。3.根据权利要求2所述的方法，其特征在于，在分别将所述待识别文本和所述多个文本语句输入至语句相似度匹配模型中之前，所述方法还包括：获取开放域文本样本数据，并基于所述文本样本数据训练得到初始语句相似度对比模型；基于所述文本语料集、第一目标损失函数和第二目标损失函数训练所述初始语句相似度对比模型得到所述语句相似度匹配模型，其中，所述第一目标损失函数为基于所述多个表情标签确定的有监督对比学习目标函数，所述第二目标损失函数为无监督对比学习目标函数。4.根据权利要求3所述的方法，其特征在于，所述基于所述文本语料集、第一目标损失函数和第二目标损失函数训练所述初始语句相似度对比模型得到所述语句相似度匹配模型包括：基于预设权重系数确定所述第一目标损失函数和第二目标损失函数的加权和作为第三目标损失函数；基于所述文本语料集、第三目标损失函数训练所述初始语句相似度对比模型，得到训练完备的所述语句相似度匹配模型。5.根据权利要求3所述的方法，其特征在于，在所述基于所述文本语料集、第一目标损失函数和第二目标损失函数训练所述初始语句相似度对比模型得到所述语句相似度匹配模型之前，还包括：滤除所述文本语料集中的干扰信息，并确定大于预设字数且仅包含相同类型表情标签的预处理文本语句；拆分所述预处理文本语句，得到相匹配的所述多个文本语句和所述多个表情标签。6.根据权利要求1所述的方法，其特征在于，所述基于所述相似度值和所述多个表情标签确定所述待识别文本的表情特征向量包括：获取所述文本语料集中相似度值最高的预设数量的文本语句，并确定与所...

【专利技术属性】
技术研发人员：李太豪，阮玉平，
申请(专利权)人：之江实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人