当前位置: 首页 > 专利查询>中山大学专利>正文

一种基于常识推理的文本情绪深层原因识别方法及装置制造方法及图纸

技术编号:43812276 阅读:21 留言:0更新日期:2024-12-27 13:27
本发明专利技术涉及人工智能技术领域,公开了一种基于常识推理的文本情绪深层原因识别方法及装置,先识别文中的潜在情感子句和潜在原因子句,构建相应的情感子句图和原因子句图;然后,检索出与这些子句相关的情感和因果常识来扩展图结构,得到两个图神经网络分别表征情感和原因图的上下文语义以及常识知识;并利用交互注意力机制找出相关度最大的情感‑原因组合子句对,进一步解码出具有较强因果关系的深层原因与对应的情感。由于充分刻画文本语法结构并融合相关的外部常识,本发明专利技术能更好地解码出深层的情感原因,实现对文本表面情感原因事件背后潜在的深层情感原因挖掘,有效提升了情感原因推断的准确性和可靠性。

【技术实现步骤摘要】

本专利技术涉及人工智能,特别是涉及一种基于常识推理的文本情绪深层原因识别方法及装置


技术介绍

1、随着互联网的快速发展,越来越多带有主观情绪的文本数据产生,譬如电商领域的评论数据,心理咨询领域的对话数据等。这些情绪是一系列由感觉、认知、思想和行为等多种因素综合产生的身心状态。这种带有情绪的文本蕴含着丰富的主观知识,反映着人们的喜好与感受。挖掘这些偏好知识具有重要的价值。决策者从现象中看到本质,实现从“知其然”到“知其所以然”,解决根源原因的问题。譬如在对话系统中,通过分析用户在对话表达中蕴含的情感和原因,机器可以生成更契合的回复;对于产品或服务运营,企业可以通过分析评论数据中用户的情绪和诱发的内在原因,准确把握用户的真实体验和需求。这有利于明确改进和优化方向,推出更符合消费者预期的产品和服务。

2、针对情绪原因发现的问题,现有工作大多只关注激发情绪的浅层原因上,对深层原因的研究很薄弱。此处的“浅层”和“深层”指语义的认知程度。浅层原因一般指出现在文本字面上的情绪原因或者事件,人们可以直接提取原因事件所在的句子,或通过“导致”“由于”等线索词从本文档来自技高网...

【技术保护点】

1.一种基于常识推理的文本情绪深层原因识别方法,其特征在于,包括:

2.根据权利要求1所述的基于常识推理的文本情绪深层原因识别方法,其特征在于,在步骤S1中,先对文本中的句子进行预处理分词,并将得到的词汇在情感词典SentiWordNet中检索,把词汇出现在情感词典SentiWordNet中的子句视为潜在情感子句,得到潜在情感子句集合并将文本中的全部句子都视为潜在原因子句,得到潜在原因子句集合

3.根据权利要求2所述的基于常识推理的文本情绪深层原因识别方法,其特征在于,使用预训练模型RoBERTa对文本中的所有子句进行编码,目的是得到每个子句ci的向量表征vi,以...

【技术特征摘要】

1.一种基于常识推理的文本情绪深层原因识别方法,其特征在于,包括:

2.根据权利要求1所述的基于常识推理的文本情绪深层原因识别方法,其特征在于,在步骤s1中,先对文本中的句子进行预处理分词,并将得到的词汇在情感词典sentiwordnet中检索,把词汇出现在情感词典sentiwordnet中的子句视为潜在情感子句,得到潜在情感子句集合并将文本中的全部句子都视为潜在原因子句,得到潜在原因子句集合

3.根据权利要求2所述的基于常识推理的文本情绪深层原因识别方法,其特征在于,使用预训练模型roberta对文本中的所有子句进行编码,目的是得到每个子句ci的向量表征vi,以便更好地理解和处理自然语言。在输入roberta前,在子句的前部和后部分别加入特殊字符[cls]和[sep]以标记句子的开始和结束,每个子句表示为其中,wi表示子句中的词。

4.根据权利要求3所述的基于常识推理的文本情绪深层原因识别方法,其特征在于,当为一个子句生成常识知识时,将该子句替换占位符,由此作为提示输入gpt大模型,通过采样可得到该子句的一组常识描述k={k1,k2,...,k10};考虑到这些描述可能含有噪音,通过点互信息pmi来过滤,点互信息pmi可以计算子句vi和每个描述k之间的相关性,参考公式(1),

5.根据权利要求4所述的基于常识推理的文本情绪深层原因识别方法,其特征在于,在步骤s1中,使用comet模型从知识库中检索与每个子句相...

【专利技术属性】
技术研发人员:余建兴郭秋彤林妙培甘梦娇印鉴
申请(专利权)人:中山大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1