当前位置: 首页 > 专利查询>之江实验室专利>正文

一种价值需求特征驱动的文本情感识别、训练方法及装置制造方法及图纸

技术编号:36046400 阅读:76 留言:0更新日期:2022-12-21 10:54
本发明专利技术公开了一种价值需求特征驱动的文本情感识别、训练方法及装置,包括价值需求标注语料采集模块、价值需求回归模型构建模块、输入文本特征提取模块和文本情感预测模块,通过采集原始短文本,并对每条短文本,基于不同的维度的价值需求,进行价值需求标注,得到价值需求标注语料集;于预训练语言模型,在价值需求标注语料上进行微调学习,得到训练好的价值需求回归模型;基于价值回归模型提取输入文本的价值需求特征,基于预训练语言模型提取输入文本的语义特征;基于输入文本的价值需求特征和语义特征,进行最终的情感识别。本发明专利技术可有效提升文本情感识别的精度。有效提升文本情感识别的精度。有效提升文本情感识别的精度。

【技术实现步骤摘要】
一种价值需求特征驱动的文本情感识别、训练方法及装置


[0001]本专利技术涉及人工智能领域,尤其是涉及一种价值需求特征驱动的文本情感识别、训练方法及装置。

技术介绍

[0002]情感识别作为人工智能领域的重要研究方向,识别输入文本中的情感信息有着广泛的应用场景,例如智慧客服、聊天机器人、医疗陪护等。文本情感识别一般形式化为离散类别分类任务,在领域内已有较多的研究工作。传统的文本情感识别方法多基于情感词汇、特定短语的分析等规则方法,现阶段主流的文本情感识别方法大多是以神经网络为代表的深度学习方法,这类方法依赖于大量的情感标注信息,通过神经网络编码器提取文本中的语义信息,并学习语义信息与情感标签之间的映射关系来实现文本的情感预测。
[0003]然而,情感作为人类对客观外部环境的主观感受,其内在因素十分复杂,当前主流深度学习方法仅仅依赖情感标签的监督信息难以实现对诱发情感的深层次原因理解建模,因而在实际情感预测场景中仍面临较大困难。而情感作为人类价值需求的一种外在反应,其提供了深层次理解建模人类情感的一种有效途径。
>
技术实现思路
...

【技术保护点】

【技术特征摘要】
1.一种价值需求特征驱动的文本情感识别训练方法,其特征在于包括如下步骤:步骤S1:价值需求标注语料采集;采集原始短文本,并对每条短文本,基于不同的维度的价值需求,进行价值需求标注,得到价值需求标注语料集;步骤S2:价值需求回归模型构建;基于预训练语言模型,在价值需求标注语料上进行微调学习,得到训练好的价值需求回归模型,包括如下步骤:步骤S21:针对价值需求标注语料集中的短文本,将其对应的字符序列与预定义的价值维度特殊字符进行拼接,得到字符序列,其中i表示短文本的索引;步骤S22:将字符序列输入到预训练的语言模型中,并取价值维度特殊字符在语言模型最后一层编码层输出的编码向量,作为短文本在不同维度的价值特征编码;步骤S23:将短文本的不同维度的价值特征编码向量分别输入到不同的单层全连接网络中,并采用激活函数,得到对应不同价值维度的标量预测值;步骤S24:计算语言模型预测价值与标注价值之间的误差,并将其作为微调训练语言模型的损失函数,得到训练好的价值需求回归模型。2.根据权利要求1所述的一种价值需求特征驱动的文本情感识别训练方法,其特征在于,所述步骤S1中,基于马斯洛夫需求层次理论的生理需求、安全需求、归属与爱、尊重需求和自我实现5个角度,分别进行多维度的价值需求标注;所述步骤S21中,字符序列;所述步骤S22中,取价值维度特殊字符至在语言模型最后一层编码层输出的编码向量,作为短文本在生理需求、安全需求、归属与爱、尊重需求和自我实现5个维度的价值特征编码;步骤S23中,将短文本的5个维度的价值特征编码向量分别输入到5个不同的单层全连接网络中,并采用激活函数,得到对应不同价值维度的标量预测值。3.根据权利要求1所述的一种价值需求特征驱动的文本情感识别训练方法,其特征在于,所述步骤S1包括如下步骤:步骤S11:获取大量短文本语句,形成原始短文本语料集;步骤S12:利用正则表达式对原始短文本语料集中的每条文本语句进行清洗,去除干扰信息;步骤S13:过滤字数范围阈值以外的短语句,得到最终清洗干净的短文本语料集:其中表示第i条单条短文本语句,表示该语料集的大小;步骤S14:对干净的短文本语料集中的每条语句从马斯洛夫需求层次理论的生理需求、安全需求、归属与爱、尊重需求和自我实现5个角度分别进行标注,得到价值需求标注语料集:
其中表示5维价值标注向量,每个维度的价值标注向量通过不同取值区分为文本与该价值维度是正相关、文本与该价值维度无关、文本与该价值维度负相关;步骤S15:重复多次步骤S14中的标注过程并取均值,作为最终短文本语句的价值需求标签。4.根据权利要求1所述的一种价值需求特征驱动的文本情感识别训练方法,其特征在于,所述步骤S23中,标量预测值的计算公式如下:其中,表示一维的标量值,j表示不同价值维度的索引,和表示语言模型的权重和偏置,tanh表示非线性激活函数。5.根据权利要求1所述的一种价值需求特征驱动的文本情感识别训练方法,其特征在于,所述步骤S24中,损失函数计算如下:其中表示第i条短文本的第j个价值维度的标量预测值,表示第i条短文本的第j个价值维度的价值标注向量...

【专利技术属性】
技术研发人员:阮玉平李太豪
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1