一种基于反馈强化学习融合归因的事件极性分析方法技术

技术编号:41554145 阅读:15 留言:0更新日期:2024-06-06 23:40
本发明专利技术涉及一种基于反馈强化学习融合归因的事件极性分析方法,属于强化学习和自然语言处理技术领域。本发明专利技术基于反馈强化学习,通过人类评估者提供的反馈来学习不同情境下的归因信息,将归因信息融合到事件极性分析任务中。本方法不仅仅关注于找出“正确”的答案,而是强调理解和解释事件背后的多维度信息。在事件极性分析的背景下,这意味着模型不仅能判断事件是否真实发生,而且能够理解事件发生的原因、背景和可能的影响,从而能够获取更佳的性能。

【技术实现步骤摘要】

本专利技术涉及一种基于反馈强化学习融合归因的事件极性分析方法,属于强化学习和自然语言处理。


技术介绍

1、事件极性分析,旨在判断文献或文档中所描述的指定事件在现实世界中的真实发生情况,而所描述的事件并不一定都在现实世界中真实发生。例如,“他的专辑已经卖掉两千万张了”中的“卖掉”是已经发生的,而“我梦见自己获得了图灵奖”中的“获得”却并未实际发生。

2、事件极性的辨析,可以为事件知识抽取以及事粒图谱构建等自然语言处理应用提供支撑。同时,事件极性的辨析通过为事件知识抽取等应用提供支撑,对于构建大规模开放域知识库也具有一定帮助,能够助力于缓解大语言模型的幻觉问题。

3、有研究表明,将任务相关的归因信息输入到大型语言模型中,可以显著提升模型的推理性能。例如,wei et al提出了思维链(chain-of-thought),模拟人类做推理的过程,将任务的多步中间推理步骤作为prompt输入到大语言模型中,能够大幅提升模型解决数学计算、常识推理等任务的性能;besta et al通过图抽象的方法,将思维链泛化到具有多种推理路径的思维图,加入了本文档来自技高网...

【技术保护点】

1.一种基于反馈强化学习融合归因的事件极性分析方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种基于反馈强化学习融合归因的事件极性分析方法,其特征在于,步骤1.2中,采用以下方式进行分类判断:

【技术特征摘要】

1.一种基于反馈强化学习融合归因的事件极性分析方法,其特征在于,包括以下步骤:

2.如权利要求1...

【专利技术属性】
技术研发人员:徐进辛欣
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1