System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于连接词增强的双流情感因果关系抽取方法及系统技术方案_技高网

一种基于连接词增强的双流情感因果关系抽取方法及系统技术方案

技术编号:40545319 阅读:7 留言:0更新日期:2024-03-05 19:02
本发明专利技术属于信息抽取领域,提供基于连接词增强的双流情感因果关系抽取方法及系统。其中,基于连接词增强的双流情感因果关系抽取方法包括对文本进行编码,得到文本中各个子句的隐状态表示;抽取出所有情感句和原因句;构建第一句对集合以及第二句对集合;得到各个集合对应的每个连接词及其隐状态表示;将第一句对集合中各个子句的隐状态表示与连接词的隐状态表示连接,得到句子对第一隐状态表示;将第二子句对集合中各个子句的隐状态表示与连接词的隐状态表示连接,得到句子对第二隐状态表示;根据句子对第一隐状态表示和句子对第二隐状态表示分别与句子对的映射关系,对应抽取出情感‑原因句子对以及原因‑情感句子对,确定出双流情感因果关系。

【技术实现步骤摘要】

本专利技术属于信息抽取领域,尤其涉及一种基于连接词增强的双流情感因果关系抽取方法及系统


技术介绍

1、本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。

2、情感-原因分析(emotion-cause analysis,eca)旨在提取情感表达,识别情感背后的原因,有助于人机交互、陪伴、抑郁治疗等的应用。gui等人(2016)首先提出提取一些情感的原因并构建相应的语料库。xia等人(2019)随后提出了情感-原因句子对提取(emotion-cause pair extraction,ecpe)的任务,该任务旨在提取由情感及其相应原因组成的所有可能的情感-原因句子对,这是一项在很大程度上取决于上下文的任务,因为模型需要找到情感与其原因之间的深层关系。以往关于ecpe的方法可分为两类,即子句配对矩阵法和序列标记法。ding等人(2020)、wei等人(2020)使用了子句配对矩阵方法,尝试从包含所有子句组合的矩阵中识别情感-原因句子对。但这种方法构造的矩阵十分稀疏,导致计算成本极高。chen等人(2020)、yuan等人(2020)使用了序列标注方法,探索了一些新颖的标注方案来识别情感和原因,但这种方法不能很好地模拟情感与其相应原因之间的关系。

3、综上所述,目前的情感-原因分析技术方案的过程为先提取情感,然后提取其相应的原因;先提取情感的原因,再提取情感,这样导致单独研究情感-原因句子对关系或原因-情感句子对关系可能会产生错误或不完整的结果,降低了情感因果关系抽取的正确率。>

技术实现思路

1、为了解决上述
技术介绍
中存在的技术问题,本专利技术提供一种基于连接词增强的双流情感因果关系抽取方法及系统,通过预测连接词来揭示情感与其原因之间的因果关系,分别抽取情感和原因的情感因果表示的双向抽取因果关系,能够避免单独研究情感-原因句子对关系或原因-情感句子对关系所产生的错误的、不完整的结果,提高情感因果关系抽取的正确率。

2、为了实现上述目的,本专利技术采用如下技术方案:

3、本专利技术的第一个方面提供一种基于连接词增强的双流情感因果关系抽取方法。

4、一种基于连接词增强的双流情感因果关系抽取方法,其包括:

5、对文本进行编码,得到文本中各个子句的隐状态表示;

6、根据已知的子句隐状态表示分别与情感和原因的映射关系,对应得到文本中各个子句为情感句的概率和原因句的概率,抽取出所有情感句和原因句;

7、根据各个子句为情感句或原因句的概率,构建第一句对集合以及第二句对集合;其中,第一句对集合元素为情感与所有候选原因子句对;第二句对集合中元素为原因与所有候选情感子句对;

8、利用掩码语言模型分别处理第一句对集合以及第二句对集合中的各个子句对,得到各个集合对应的每个连接词及其隐状态表示;

9、将第一句对集合中各个子句的隐状态表示与连接词的隐状态表示连接,得到句子对第一隐状态表示;将第二子句对集合中各个子句的隐状态表示与连接词的隐状态表示连接,得到句子对第二隐状态表示;根据句子对第一隐状态表示和句子对第二隐状态表示分别与句子对的映射关系,对应抽取出情感-原因句子对以及原因-情感句子对,确定出双流情感因果关系。

10、本专利技术的第二个方面提供一种基于连接词增强的双流情感因果关系抽取系统。

11、一种基于连接词增强的双流情感因果关系抽取系统,其包括:

12、隐状态表示模块,其用于对文本进行编码,得到文本中各个子句的隐状态表示;

13、情感和原因句抽取模块,其用于根据已知的子句隐状态表示分别与情感和原因的映射关系,对应得到文本中各个子句为情感句的概率和原因句的概率,抽取出所有情感句和原因句;

14、子句配对模块,其用于根据各个子句为情感句或原因句的概率,构建第一句对集合以及第二句对集合;其中,第一句对集合元素为情感与所有候选原因子句对;第二句对集合中元素为原因与所有候选情感子句对;

15、连接词抽取模块,其用于利用掩码语言模型分别处理第一句对集合以及第二句对集合中的各个子句对,得到各个集合对应的每个连接词及其隐状态表示;

16、因果关系确定模块,其用于将第一句对集合中各个子句的隐状态表示与连接词的隐状态表示连接,得到句子对第一隐状态表示;将第二子句对集合中各个子句的隐状态表示与连接词的隐状态表示连接,得到句子对第二隐状态表示;根据句子对第一隐状态表示和句子对第二隐状态表示分别与句子对的映射关系,对应抽取出情感-原因句子对以及原因-情感句子对,确定出双流情感因果关系。

17、本专利技术的第三个方面提供一种计算机可读存储介质。

18、一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的基于连接词增强的双流情感因果关系抽取方法中的步骤。

19、本专利技术的第四个方面提供一种计算机设备。

20、一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的基于连接词增强的双流情感因果关系抽取方法中的步骤。

21、与现有技术相比,本专利技术的有益效果是:

22、(1)本专利技术所提供的基于连接词增强的双流情感因果关系抽取方法及系统,从情感与所有候选原因子句对以及原因与所有候选情感子句对中抽取连接词,利用连接词补全了文本结构,还揭示了情感与其原因之间的因果关系,突出了情感和原因之间的联系,从而提高了因果关系抽取的效果。

23、(2)本专利技术通过抽取情感-原因句子对以及原因-情感句子对,实现情感和原因双向抽取因果关系,最终整合出情感-原因句子对的关键信息,同时探索了“给定情感效应的原因是什么”和“给定原因的情感效应是什么”,避免了单独研究情感-原因句子对关系或原因-情感句子对关系所产生的错误的、不完整的结果,从而提高了情感因果关系抽取的效果。

24、本专利技术附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。

本文档来自技高网...

【技术保护点】

1.一种基于连接词增强的双流情感因果关系抽取方法,其特征在于,包括:

2.如权利要求1所述的基于连接词增强的双流情感因果关系抽取方法,其特征在于,文本中各个子句的隐状态表示的过程为:

3.如权利要求2所述的基于连接词增强的双流情感因果关系抽取方法,其特征在于,构建子句的中间隐状态表示的过程为:

4.如权利要求2所述的基于连接词增强的双流情感因果关系抽取方法,其特征在于,得到各个集合对应的每个连接词及其隐状态表示的过程包括:

5.如权利要求1所述的基于连接词增强的双流情感因果关系抽取方法,其特征在于,在得到各个集合对应的每个连接词的过程中所遵循的规则包括:

6.一种基于连接词增强的双流情感因果关系抽取系统,其特征在于,包括:

7.如权利要求6所述的基于连接词增强的双流情感因果关系抽取系统,其特征在于,所述隐状态表示模块包括:

8.如权利要求7所述的基于连接词增强的双流情感因果关系抽取系统,其特征在于,在所述中间隐状态表示模块中,构建子句的中间隐状态表示的过程为:

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一项所述的基于连接词增强的双流情感因果关系抽取方法中的步骤。

10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-5中任一项所述的基于连接词增强的双流情感因果关系抽取方法中的步骤。

...

【技术特征摘要】

1.一种基于连接词增强的双流情感因果关系抽取方法,其特征在于,包括:

2.如权利要求1所述的基于连接词增强的双流情感因果关系抽取方法,其特征在于,文本中各个子句的隐状态表示的过程为:

3.如权利要求2所述的基于连接词增强的双流情感因果关系抽取方法,其特征在于,构建子句的中间隐状态表示的过程为:

4.如权利要求2所述的基于连接词增强的双流情感因果关系抽取方法,其特征在于,得到各个集合对应的每个连接词及其隐状态表示的过程包括:

5.如权利要求1所述的基于连接词增强的双流情感因果关系抽取方法,其特征在于,在得到各个集合对应的每个连接词的过程中所遵循的规则包括:

6.一种基于连接词增强的双流情感因果关系抽取系统,其特征在...

【专利技术属性】
技术研发人员:冉浚枫严莉常英贤汤琳琳王高洲张闻彬潘法定呼海林李素建
申请(专利权)人:国网山东省电力公司信息通信公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1