实体抽取方法及装置制造方法及图纸

技术编号:41876661 阅读:29 留言:0更新日期:2024-07-02 00:29
本发明专利技术实施例公开了一种实体抽取方法及装置,涉及自然语言处理技术领域,可用于金融领域或其他技术领域,该方法包括:对目标文本的字符向量和上下文向量进行混合编码,得到混合编码向量;将所述混合编码向量输入到膨胀卷积层,得到所述膨胀卷积层输出的融合后的向量;基于所述融合后的向量以及预设的标签预测模型,得到命名实体标签预测结果;基于所述命名实体标签预测结果得到所述目标文本的命名实体抽取结果。本发明专利技术有助于提高实体抽取的效果。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,具体而言,涉及一种实体抽取方法及装置


技术介绍

1、命名实体识别在金融领域有着广泛的应用,例如,识别票据中的人名、企业名称、日期、金额等。目前的命名实体识别通常采用自然语言处理模型来进行识别,例如,采用bert等模型。但目前的命名实体识别准确性仍存在不足,如何提高命名实体识别的准确性是现有技术急需解决的问题。


技术实现思路

1、本专利技术为了解决上述
技术介绍
中的至少一个技术问题,提出了一种实体抽取方法及装置。

2、为了实现上述目的,根据本专利技术的一个方面,提供了一种实体抽取方法,该方法包括:

3、对目标文本的字符向量和上下文向量进行混合编码,得到混合编码向量;

4、将所述混合编码向量输入到膨胀卷积层,得到所述膨胀卷积层输出的融合后的向量;

5、基于所述融合后的向量以及预设的标签预测模型,得到命名实体标签预测结果;

6、基于所述命名实体标签预测结果得到所述目标文本的命名实体抽取结果。

7、可选的,所述的对目标本文档来自技高网...

【技术保护点】

1.一种实体抽取方法,其特征在于,包括:

2.根据权利要求1所述的实体抽取方法,其特征在于,所述的对目标文本的字符向量和上下文向量进行混合编码,得到混合编码向量,具体包括:

3.根据权利要求1所述的实体抽取方法,其特征在于,所述标签预测模型包括:第一预测模型和第二预测模型;

4.根据权利要求3所述的实体抽取方法,其特征在于,所述第一预测模型包括:双向长短期记忆神经网络和第一条件随机场模型;所述双向长短期记忆神经网络用于从所述融合后的向量中提取出特征数据,所述第一条件随机场模型用于基于所述特征数据输出所述第一标签序列。

5.根据权利要求3所述...

【技术特征摘要】

1.一种实体抽取方法,其特征在于,包括:

2.根据权利要求1所述的实体抽取方法,其特征在于,所述的对目标文本的字符向量和上下文向量进行混合编码,得到混合编码向量,具体包括:

3.根据权利要求1所述的实体抽取方法,其特征在于,所述标签预测模型包括:第一预测模型和第二预测模型;

4.根据权利要求3所述的实体抽取方法,其特征在于,所述第一预测模型包括:双向长短期记忆神经网络和第一条件随机场模型;所述双向长短期记忆神经网络用于从所述融合后的向量中提取出特征数据,所述第一条件随机场模型用于基于所述特征数据输出所述第一标签序列。

5.根据权利要求3所述的实体抽取方法,其特征在于,所述第二预测模型包括:第二条件随机场模型;所述第二条件随机场模型用于基于所述融合后的向量输出所述第二标签序列。

6.根据权利...

【专利技术属性】
技术研发人员:戚博炜徐虹李亨达谈宁远
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1