【技术实现步骤摘要】
本专利技术涉及自然语言处理领域,特别是一种碳金融领域中文文本的实体关系联合抽取方法及系统。
技术介绍
1、在碳金融知识图谱构建过程中,关系抽取作为核心技术环节,其作用是从非结构化文本中自动提取(头实体,关系,尾实体)结构化三元组。传统关系抽取方法主要采用流水线式处理框架,通过分阶段执行实体识别与关系分类任务。近年来,联合抽取方法通过构建实体识别与关系分类的联合模型,实现了端到端的三元组抽取,在性能指标上展现出显著优势。现有技术中,pfn(apartition filter network for joint entity and relationextraction,2021)提出分区过滤网络架构,通过深层交互机制促进命名实体识别与关系抽取任务的协同优化,取得了较优的抽取性能。
2、当前关系抽取领域存在两种主要技术路线:基于双向注意力机制的编码器模型和基于因果注意力的解码器模型。前者在基准测试中保持性能优势,但受限于模型规模与知识容量瓶颈,典型编码器模型如bert的参数规模通常不超过数亿量级,且存在知识更新效率低下的问题。后
...【技术保护点】
1.一种碳金融领域中文文本的实体关系联合抽取方法,其特征在于,所述方法包括以下步骤:
2.如权利要求1所述的碳金融领域中文文本的实体关系联合抽取方法,其特征在于,所述步骤二中,Atom-7B大语言模型混合注意力增强的过程如下:
3.如权利要求2所述的碳金融领域中文文本的实体关系联合抽取方法,其特征在于,所述步骤三中,训练实体关系联合抽取模型的过程如下:
4.一种如权利要求1所述的碳金融领域中文文本的实体关系联合抽取系统,其特征在于,所述系统包括碳金融数据收集模块、混合注意力模块、联合抽取模型训练模块和实体关系三元组输出模块。
【技术特征摘要】
1.一种碳金融领域中文文本的实体关系联合抽取方法,其特征在于,所述方法包括以下步骤:
2.如权利要求1所述的碳金融领域中文文本的实体关系联合抽取方法,其特征在于,所述步骤二中,atom-7b大语言模型混合注意力增强的过程如下:
3.如权利要求2所述的碳金融领域...
【专利技术属性】
技术研发人员:徐新黎,姚高超,韩博文,杨旭华,姚信威,李响,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。