【技术实现步骤摘要】
本专利技术涉及自然语言处理、关系抽取的,尤其涉及一种金融文本关系抽取方法、系统及存储介质。
技术介绍
1、随着互联网的发展,金融领域的数字化进程加快,其中产生了大量的文本数据,如何准确高效利用金融文本数据成为一个关键问题。信息抽取有助于从大量金融文本数据中抽取有用信息,提升金融决策智能化的关键手段。然而,金融领域文本表达的多样性,样本数量的稀缺性,任务需求的复杂性,对金融领域的关系抽取工作带来挑战。
技术实现思路
1、为至少一定程度上解决现有技术中存在的技术问题之一,本专利技术的目的在于提供一种金融文本关系抽取方法、系统及存储介质。
2、本专利技术所采用的技术方案是:
3、一种金融文本关系抽取方法,包括以下步骤:
4、预处理金融文本数据,将文本拆解为句子级的输入序列,并加上实体标记;
5、将所述输入序列的各词语转换为嵌入向量,并获取各词语的上下文序列信息,得到输入序列的表征;
6、根据所述输入序列的表征提取词语之间的依存关系,得到
...【技术保护点】
1.一种金融文本关系抽取方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种金融文本关系抽取方法,其特征在于,所述预处理金融文本数据,将文本拆解为句子级的输入序列,并加上实体标记,包括:
3.根据权利要求1所述的一种金融文本关系抽取方法,其特征在于,所述将所述输入序列的各词语转换为嵌入向量,并获取各词语的上下文序列信息,得到输入序列的表征,包括:
4.根据权利要求1所述的一种金融文本关系抽取方法,其特征在于,所述根据所述输入序列的表征提取词语之间的依存关系,得到句法增强表征,包括:
5.根据权利要求1所述的一种
...【技术特征摘要】
1.一种金融文本关系抽取方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种金融文本关系抽取方法,其特征在于,所述预处理金融文本数据,将文本拆解为句子级的输入序列,并加上实体标记,包括:
3.根据权利要求1所述的一种金融文本关系抽取方法,其特征在于,所述将所述输入序列的各词语转换为嵌入向量,并获取各词语的上下文序列信息,得到输入序列的表征,包括:
4.根据权利要求1所述的一种金融文本关系抽取方法,其特征在于,所述根据所述输入序列的表征提取词语之间的依存关系,得到句法增强表征,包括:
5.根据权利要求1所述的一种金融文本关系抽取方法,其特征在于,所述金融实体的类型信息通过实体类型注意力模块进行提取,包括:
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。