文本处理方法、装置、设备、介质和程序产品制造方法及图纸

技术编号:41591837 阅读:19 留言:0更新日期:2024-06-07 00:03
本公开提供了一种文本处理方法、装置、设备、介质和程序产品,可以应用于自然语言处理领域和金融领域。该方法包括:对待处理文本进行实体边界检测,得到与待处理字相关的实体边界特征和实体特征,其中,待处理文本包括多个待处理字;基于注意力机制处理实体边界特征和实体特征,得到实体类型特征,其中,实体类型特征表征待处理字的实体类型;基于实体类型特征和实体边界特征对待处理文本进行实体识别,得到与待处理文本相对应的实体序列。

【技术实现步骤摘要】

本公开涉及自然语言处理领域和金融领域,更具体地,涉及一种文本处理方法、装置、设备、介质和程序产品


技术介绍

1、现有的文本处理方法主要分为基于规则和词典的方法、基于统计的方法。基于规则和词典的方法,在手工构造规则具有主观性较强的特点,且对于不同的语言和领域需要制定相应的规则,可移植性差,难以适应语言的变化和新实体的出现。而在基于统计的方法中,模型性能容易受到语料质量和多样性的影响,对于未在训练语料中出现过的实体效果可能不佳。


技术实现思路

1、鉴于上述问题,本公开提供了一种文本处理方法、装置、设备、介质和程序产品。

2、根据本公开的第一个方面,提供了一种文本处理方法,包括:

3、对待处理文本进行实体边界检测,得到与待处理字相关的实体边界特征和实体特征,其中,待处理文本包括多个待处理字;基于注意力机制处理实体边界特征和实体特征,得到实体类型特征,其中,实体类型特征表征待处理字的实体类型;基于实体类型特征和实体边界特征对待处理文本进行实体识别,得到与待处理文本相对应的实体序列。

<本文档来自技高网...

【技术保护点】

1.一种文本处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对待处理文本进行实体边界检测,得到与待处理字相关的实体边界特征和实体特征,包括:

3.根据权利要求2所述的方法,其特征在于,所述将所述初始实体特征和所述实体邻接特征输入至图卷积神经网络中,得到所述实体特征,包括:

4.根据权利要求1所述的方法,其特征在于,所述基于注意力机制处理所述实体边界特征和所述实体特征,得到实体类型特征,包括:

5.根据权利要求4所述的方法,其特征在于,所述基于注意力机制处理所述注意力权重矩阵和所述实体特征,得到所述实体类型...

【技术特征摘要】

1.一种文本处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对待处理文本进行实体边界检测,得到与待处理字相关的实体边界特征和实体特征,包括:

3.根据权利要求2所述的方法,其特征在于,所述将所述初始实体特征和所述实体邻接特征输入至图卷积神经网络中,得到所述实体特征,包括:

4.根据权利要求1所述的方法,其特征在于,所述基于注意力机制处理所述实体边界特征和所述实体特征,得到实体类型特征,包括:

5.根据权利要求4所述的方法,其特征在于,所述基于注意力机制处理所述注意力权重矩阵和所述实体特征,得到所述实体类型特征,包括:

6.根据权利要求1所述的方法,其特征在于...

【专利技术属性】
技术研发人员:陈辉兴
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1