一种金融文本关系抽取方法、系统及存储介质技术方案

技术编号:41317179 阅读:15 留言:0更新日期:2024-05-13 14:58
本发明专利技术公开了一种金融文本关系抽取方法、系统及存储介质,属于自然语言处理技术领域。方法包括:预处理金融文本数据,将文本拆解为句子级的输入序列,并加上实体标记;将输入序列的各词语转换为嵌入向量,并获取各词语的上下文序列信息,得到输入序列的表征;根据输入序列的表征提取词语之间的依存关系,得到句法增强表征;根据句法增强表征分别提取金融实体的类型信息和上下文信息;引入金融实体外部知识库,并提取金融实体的知识增强表征;预测实体之间的关系类别,作为金融文本关系抽取的结果。本发明专利技术通过基于依存句法树的注意力机制捕获文本的句法增强特征,并通过注意力机制和外部知识图卷积增强金融实体信息,提高金融文本的关系抽取性能。

【技术实现步骤摘要】

本专利技术涉及自然语言处理、关系抽取的,尤其涉及一种金融文本关系抽取方法、系统及存储介质


技术介绍

1、随着互联网的发展,金融领域的数字化进程加快,其中产生了大量的文本数据,如何准确高效利用金融文本数据成为一个关键问题。信息抽取有助于从大量金融文本数据中抽取有用信息,提升金融决策智能化的关键手段。然而,金融领域文本表达的多样性,样本数量的稀缺性,任务需求的复杂性,对金融领域的关系抽取工作带来挑战。


技术实现思路

1、为至少一定程度上解决现有技术中存在的技术问题之一,本专利技术的目的在于提供一种金融文本关系抽取方法、系统及存储介质。

2、本专利技术所采用的技术方案是:

3、一种金融文本关系抽取方法,包括以下步骤:

4、预处理金融文本数据,将文本拆解为句子级的输入序列,并加上实体标记;

5、将所述输入序列的各词语转换为嵌入向量,并获取各词语的上下文序列信息,得到输入序列的表征;

6、根据所述输入序列的表征提取词语之间的依存关系,得到句法增强表征;...

【技术保护点】

1.一种金融文本关系抽取方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种金融文本关系抽取方法,其特征在于,所述预处理金融文本数据,将文本拆解为句子级的输入序列,并加上实体标记,包括:

3.根据权利要求1所述的一种金融文本关系抽取方法,其特征在于,所述将所述输入序列的各词语转换为嵌入向量,并获取各词语的上下文序列信息,得到输入序列的表征,包括:

4.根据权利要求1所述的一种金融文本关系抽取方法,其特征在于,所述根据所述输入序列的表征提取词语之间的依存关系,得到句法增强表征,包括:

5.根据权利要求1所述的一种金融文本关系抽取方法...

【技术特征摘要】

1.一种金融文本关系抽取方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种金融文本关系抽取方法,其特征在于,所述预处理金融文本数据,将文本拆解为句子级的输入序列,并加上实体标记,包括:

3.根据权利要求1所述的一种金融文本关系抽取方法,其特征在于,所述将所述输入序列的各词语转换为嵌入向量,并获取各词语的上下文序列信息,得到输入序列的表征,包括:

4.根据权利要求1所述的一种金融文本关系抽取方法,其特征在于,所述根据所述输入序列的表征提取词语之间的依存关系,得到句法增强表征,包括:

5.根据权利要求1所述的一种金融文本关系抽取方法,其特征在于,所述金融实体的类型信息通过实体类型注意力模块进行提取,包括:

...

【专利技术属性】
技术研发人员:方宇鹏吴庆耀
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1