一种碳金融领域中文文本的实体关系联合抽取方法及系统技术方案

技术编号:46412879 阅读:4 留言:0更新日期:2025-09-16 20:00
一种碳金融领域中文文本的实体关系联合抽取方法,针对碳金融中文文本,利用Atom‑7B大模型得到文本句子的特征表示向量,然后通过PFN以联合抽取的方式得到文本中的实体关系三元组。以及提供一种碳金额领域中文文本的实体关系联合抽取系统。本发明专利技术在保持Atom‑7B大语言模型的因果注意力机制基础上,创新性地引入右侧注意力机制和双向注意力机制,构建了混合注意力机制,充分发挥了Atom‑7B在规模和知识容量方面的优势,同时通过混合注意力机制弥补了传统解码器在关系抽取任务中的固有缺陷,有效提高了关系抽取效果。本发明专利技术提升了碳金融领域中文文本中抽取实体关系三元组的性能。

【技术实现步骤摘要】

本专利技术涉及自然语言处理领域,特别是一种碳金融领域中文文本的实体关系联合抽取方法及系统


技术介绍

1、在碳金融知识图谱构建过程中,关系抽取作为核心技术环节,其作用是从非结构化文本中自动提取(头实体,关系,尾实体)结构化三元组。传统关系抽取方法主要采用流水线式处理框架,通过分阶段执行实体识别与关系分类任务。近年来,联合抽取方法通过构建实体识别与关系分类的联合模型,实现了端到端的三元组抽取,在性能指标上展现出显著优势。现有技术中,pfn(apartition filter network for joint entity and relationextraction,2021)提出分区过滤网络架构,通过深层交互机制促进命名实体识别与关系抽取任务的协同优化,取得了较优的抽取性能。

2、当前关系抽取领域存在两种主要技术路线:基于双向注意力机制的编码器模型和基于因果注意力的解码器模型。前者在基准测试中保持性能优势,但受限于模型规模与知识容量瓶颈,典型编码器模型如bert的参数规模通常不超过数亿量级,且存在知识更新效率低下的问题。后者以llama大语言本文档来自技高网...

【技术保护点】

1.一种碳金融领域中文文本的实体关系联合抽取方法,其特征在于,所述方法包括以下步骤:

2.如权利要求1所述的碳金融领域中文文本的实体关系联合抽取方法,其特征在于,所述步骤二中,Atom-7B大语言模型混合注意力增强的过程如下:

3.如权利要求2所述的碳金融领域中文文本的实体关系联合抽取方法,其特征在于,所述步骤三中,训练实体关系联合抽取模型的过程如下:

4.一种如权利要求1所述的碳金融领域中文文本的实体关系联合抽取系统,其特征在于,所述系统包括碳金融数据收集模块、混合注意力模块、联合抽取模型训练模块和实体关系三元组输出模块。

【技术特征摘要】

1.一种碳金融领域中文文本的实体关系联合抽取方法,其特征在于,所述方法包括以下步骤:

2.如权利要求1所述的碳金融领域中文文本的实体关系联合抽取方法,其特征在于,所述步骤二中,atom-7b大语言模型混合注意力增强的过程如下:

3.如权利要求2所述的碳金融领域...

【专利技术属性】
技术研发人员:徐新黎姚高超韩博文杨旭华姚信威李响
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1