一种实体间关联关系的确定方法、装置、终端设备及介质制造方法及图纸

技术编号:26792143 阅读:47 留言:0更新日期:2020-12-22 17:07
本公开公开了一种实体间关联关系的确定方法、装置、终端设备及介质。所述方法包括:确定文本信息中的主体实体和属性实体;将确定出的每个主体实体和确定出的每个属性实体输入至关联度模型,确定每个所述主体实体与各所述属性实体间的关联度信息;根据所述关联度信息,确定实体间的关联关系。利用该方法,有效的解决了因属性实体缺失或过多造成的实体关联错误的技术问题,提升了实体间关联关系确定的准确性。

【技术实现步骤摘要】
一种实体间关联关系的确定方法、装置、终端设备及介质
本公开实施例涉及计算机
,尤其涉及一种实体间关联关系的确定方法、装置、终端设备及介质。
技术介绍
在文本信息抽取的应用场景中,常常需要建立文本信息中实体间的关联。不同的业务场景下,可以建立不同实体与其他实体间的关联。如,在对教育经历进行分析时,需要首先从文本信息中识别出学校实体,然后抽取该学校实体与其他实体如专业的关联。其中,学校实体可以认为是主体实体,与主体关联的其他实体可以称之为属性实体。然而,当属性实体缺失或多识别出属性实体时,会造成实体关联错误,故因属性实体缺失或过多造成的实体关联错误的技术问题是亟待解决的。
技术实现思路
本公开实施例提供了一种实体间关联关系的确定方法、装置、终端设备及介质,有效解决了因属性实体缺失或过多造成的实体关联错误的技术问题。第一方面,本公开实施例提供了一种实体间关联关系的确定方法,包括:确定文本信息中的主体实体和属性实体;将确定出的每个主体实体和确定出的每个属性实体输入至关联度模型,确定每个所述主体实本文档来自技高网...

【技术保护点】
1.一种实体间关联关系的确定方法,其特征在于,包括:/n确定文本信息中的主体实体和属性实体;/n将确定出的每个主体实体和确定出的每个属性实体输入至关联度模型,确定每个所述主体实体与各所述属性实体间的关联度信息;/n根据所述关联度信息,确定实体间的关联关系。/n

【技术特征摘要】
1.一种实体间关联关系的确定方法,其特征在于,包括:
确定文本信息中的主体实体和属性实体;
将确定出的每个主体实体和确定出的每个属性实体输入至关联度模型,确定每个所述主体实体与各所述属性实体间的关联度信息;
根据所述关联度信息,确定实体间的关联关系。


2.根据权利要求1所述的方法,其特征在于,所述关联度模型的训练操作包括:
基于训练样本集对预先建立的逻辑回归模型进行训练,得到关联度模型;
其中,所述训练样本集包括正样本和负样本,所述正样本包括训练用信息中相关联的训练用主体实体和训练用属性实体,所述负样本包括所述训练用信息中不关联的训练用主体实体和训练用属性实体。


3.根据权利要求2所述的方法,其特征在于,所述回归模型的特征信息包括如下一个或多个:富文本信息、实体饱和度、实体行距、实体位置信息和实体类型,富文本信息表征实体是否加粗,实体饱和度表征实体在所处句子中的占比,实体行距表征主体实体与属性实体间行距的绝对值,实体位置信息表征实体在所处文本行的位置信息,实体类型表征文本的类型。


4.根据权利要求1所述的方法,其特征在于,所述根据所述关联度信息,确定实体间的关联关系,包括:
从各所述属性实体中选取一个属性实体作为当前属性实体;
将目标实体确定为与所述当前属性实体相关联的主体实体,以实现所述当前属性实体的关联关系的构建;
继续选取当前属性实体直至各所述属性实体选取完成;
若所述当前属性实体的取值最大的关联度信息所对应的主体实体的个数为一个,将所对应的主体实体确定为所述目标实体;否则将取值最大的关联度信息所对应的每个主体实体分别确定为所述目标实体,以形成所述文本信息对应的多组关联关系,每组关联关系中包括各所述属性实体与对应主体实体的关联关系,一个属性实体对应一个主体...

【专利技术属性】
技术研发人员:同文地
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1