【技术实现步骤摘要】
本专利技术涉及人工智能,特别是涉及一种基于常识推理的文本情绪深层原因识别方法及装置。
技术介绍
1、随着互联网的快速发展,越来越多带有主观情绪的文本数据产生,譬如电商领域的评论数据,心理咨询领域的对话数据等。这些情绪是一系列由感觉、认知、思想和行为等多种因素综合产生的身心状态。这种带有情绪的文本蕴含着丰富的主观知识,反映着人们的喜好与感受。挖掘这些偏好知识具有重要的价值。决策者从现象中看到本质,实现从“知其然”到“知其所以然”,解决根源原因的问题。譬如在对话系统中,通过分析用户在对话表达中蕴含的情感和原因,机器可以生成更契合的回复;对于产品或服务运营,企业可以通过分析评论数据中用户的情绪和诱发的内在原因,准确把握用户的真实体验和需求。这有利于明确改进和优化方向,推出更符合消费者预期的产品和服务。
2、针对情绪原因发现的问题,现有工作大多只关注激发情绪的浅层原因上,对深层原因的研究很薄弱。此处的“浅层”和“深层”指语义的认知程度。浅层原因一般指出现在文本字面上的情绪原因或者事件,人们可以直接提取原因事件所在的句子,或通过“导致
...【技术保护点】
1.一种基于常识推理的文本情绪深层原因识别方法,其特征在于,包括:
2.根据权利要求1所述的基于常识推理的文本情绪深层原因识别方法,其特征在于,在步骤S1中,先对文本中的句子进行预处理分词,并将得到的词汇在情感词典SentiWordNet中检索,把词汇出现在情感词典SentiWordNet中的子句视为潜在情感子句,得到潜在情感子句集合并将文本中的全部句子都视为潜在原因子句,得到潜在原因子句集合
3.根据权利要求2所述的基于常识推理的文本情绪深层原因识别方法,其特征在于,使用预训练模型RoBERTa对文本中的所有子句进行编码,目的是得到每个子句c
...【技术特征摘要】
1.一种基于常识推理的文本情绪深层原因识别方法,其特征在于,包括:
2.根据权利要求1所述的基于常识推理的文本情绪深层原因识别方法,其特征在于,在步骤s1中,先对文本中的句子进行预处理分词,并将得到的词汇在情感词典sentiwordnet中检索,把词汇出现在情感词典sentiwordnet中的子句视为潜在情感子句,得到潜在情感子句集合并将文本中的全部句子都视为潜在原因子句,得到潜在原因子句集合
3.根据权利要求2所述的基于常识推理的文本情绪深层原因识别方法,其特征在于,使用预训练模型roberta对文本中的所有子句进行编码,目的是得到每个子句ci的向量表征vi,以便更好地理解和处理自然语言。在输入roberta前,在子句的前部和后部分别加入特殊字符[cls]和[sep]以标记句子的开始和结束,每个子句表示为其中,wi表示子句中的词。
4.根据权利要求3所述的基于常识推理的文本情绪深层原因识别方法,其特征在于,当为一个子句生成常识知识时,将该子句替换占位符,由此作为提示输入gpt大模型,通过采样可得到该子句的一组常识描述k={k1,k2,...,k10};考虑到这些描述可能含有噪音,通过点互信息pmi来过滤,点互信息pmi可以计算子句vi和每个描述k之间的相关性,参考公式(1),
5.根据权利要求4所述的基于常识推理的文本情绪深层原因识别方法,其特征在于,在步骤s1中,使用comet模型从知识库中检索与每个子句相...
【专利技术属性】
技术研发人员:余建兴,郭秋彤,林妙培,甘梦娇,印鉴,
申请(专利权)人:中山大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。