实体关系识别的方法和装置制造方法及图纸

技术编号:40466780 阅读:18 留言:0更新日期:2024-02-22 23:21
本发明专利技术公开了一种实体关系识别的方法和装置,涉及自然语言处理技术领域。该方法的一具体实施方式包括:对文本序列进行分词处理得到分词集,并结合预先设置的扩充分词集生成汇总分词集;对汇总分词集中的每个分词,分别生成分词对应的分词向量分词包括的每个字对应的字向量以及字包括的笔画所对应的笔画向量;对每个分词对应的分词向量、字向量和笔画向量进行拼接处理得到文本序列对应的特征向量;基于特征向量和预先设置的实体集与关系集进行模型训练,得到实体关系识别模型;使用实体关系识别模型进行实体关系识别。该实施方式提高了深度学习神经网络模型的收敛速度,提高了实体关系识别的准确率。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,尤其涉及一种实体关系识别的方法和装置


技术介绍

1、现有基于深度学习和自然语言进行实体关系识别的方法中,在对输入的文本序列进行编码后,一般直接输入到深度学习神经网络模型中进行特征的学习,以训练得到实体关系识别模型,并使用该模型进行实体关系识别。然而,现有的实体关系识别方法,仅依赖于文本序列训练数据进行实体关系识别模型训练,使得深度学习神经网络模型的收敛速度较慢,实体关系识别结果的准确率不高。


技术实现思路

1、有鉴于此,本专利技术实施例提供一种实体关系识别的方法和装置,能够在对文本序列进行分词处理时结合领域经验知识(即预先设置的扩充分词集),可以提高分词集的质量;在实体关系识别模型的训练中,将领域经验知识(即预先设置的实体集与关系集)作为先验知识,辅助深度学习神经网络模型的计算和预测,从而有效地提高了深度学习神经网络模型的收敛速度,提高了实体关系识别的准确率。另外,将领域经验知识(即预先设置的实体集、关系集和实体对关联关系集)作为后验知识,在特定领域应用中,使用领域经验知识对模型本文档来自技高网...

【技术保护点】

1.一种实体关系识别的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在使用所述实体关系识别模型进行实体关系识别之后,还包括:

3.根据权利要求2所述的方法,其特征在于,基于预先设置的实体集、关系集和实体对关联关系集对所述实体关系识别结果进行检测,包括:

4.根据权利要求1所述的方法,其特征在于,对所述汇总分词集中的每个分词,分别生成所述分词对应的分词向量、所述分词包括的每个字对应的字向量以及字包括的笔画所对应的笔画向量,包括:

5.根据权利要求1所述的方法,其特征在于,基于所述特征向量和预先设置的实体集与关系集进行模型...

【技术特征摘要】

1.一种实体关系识别的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在使用所述实体关系识别模型进行实体关系识别之后,还包括:

3.根据权利要求2所述的方法,其特征在于,基于预先设置的实体集、关系集和实体对关联关系集对所述实体关系识别结果进行检测,包括:

4.根据权利要求1所述的方法,其特征在于,对所述汇总分词集中的每个分词,分别生成所述分词对应的分词向量、所述分词包括的每个字对应的字向量以及字包括的笔画所对应的笔画向量,包括:

5.根据权利要求1所述的方法,其特征在于,基于所述特征向量和预先设置的实体集与关系集进行模型训练,得到实体关系...

【专利技术属性】
技术研发人员:张雷赵新宇邱小霞
申请(专利权)人:中国人民银行数字货币研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1