【技术实现步骤摘要】
人物关系抽取方法、装置、电子设备及存储介质
[0001]本专利技术涉及人工智能领域,尤其涉及一种人物关系抽取方法、装置、电子设备及存储介质。
技术介绍
[0002]随着科技的发展和社会的进步,各行各业的企业如同雨后春笋一样涌现,而在不同行业的企业之中,则存在大量且复杂的人物关系,例如,企业A中员工A和员工B存在的上下级关系,或者员工B和员工C存在的同事关系等。不同的人物关系可以作为后续对企业进行企业分析的数据基础,因此需要对企业中的人物关系进行抽取。
[0003]人物关系抽取是信息抽取领域和自然语言处理领域中的一项重要研究内容,其任务是指从自然语言文本中获取两个人物实体之间的人物关系,目前采用的人物关系抽取方法需要通过人工对人物实体和人物实体之间的人物关系进行标注,进而得到人物关系,这种方法的效率低。因此,亟待提出一种效率更高的人物关系抽取方法。
技术实现思路
[0004]本专利技术提供一种人物关系抽取方法、装置、电子设备及存储介质,其主要目的在于提高人物关系抽取的效率。
[0005]为实现上 ...
【技术保护点】
【技术特征摘要】
1.一种人物关系抽取方法,其特征在于,所述方法包括:获取预设企业数据库中的企业相关数据及所述企业相关数据中的多个人物实体,提取所述人物实体中的属性数据和关系数据,根据所述属性数据和所述关系数据对所述多个人物实体进行同一性判别处理,得到多个标准实体;将所述企业相关数据中符合预设抽取要求的数据作为待抽取文档,对所述待抽取文档进行分段处理,得到多个文档段落,利用三元组抽取模型抽取出所述多个文档段落对应的多个三元组;获取与所述三元组匹配的训练文本,利用所述训练文本对初始提取模型进行模型训练处理,得到人物关系抽取模型;将所述标准实体输入至所述人物关系抽取模型中,得到标准人物关系。2.如权利要求1所述的人物关系抽取方法,其特征在于,所述提取所述人物实体中的属性数据和关系数据,包括:将所述人物实体中的实体相关数据与预设属性参考表中的参考数据进行比对,所述预设属性参考表中包含属性类别和所述属性类别对应的参考数据;将与所述实体相关数据一致的参考数据作为所述人物实体中的属性数据;对所述属性数据进行关系分析处理,得到所述人物实体中的关系数据。3.如权利要求1所述的人物关系抽取方法,其特征在于,所述根据所述属性数据和所述关系数据对所述多个人物实体进行同一性判别处理,得到多个标准实体,包括:将多个人物实体中的任意两个人物实体作为目标实体,分别对所述目标实体对应的属性数据和所述关系数据进行向量化处理,得到属性向量和关系向量;计算所述属性向量和所述关系向量之间的相似度,并对所述相似度进行拟合处理,得到人物实体相似度;当所述人物实体相似度大于或者等于预设实体阈值时,将所述目标实体判定为相同实体,并删除所述多个人物实体中的任意一个目标实体;当所述人物实体相似度小于预设实体阈值时,将所述目标实体判定为区别实体,并保留所述多个人物实体中的区别实体;汇总保留的相同实体及区别实体,得到多个标准实体。4.如权利要求1所述的人物关系抽取方法,其特征在于,所述对所述待抽取文档进行分段处理,得到多个文档段落,包括:获取多个文档及所述文档对应的分段结果,以所述分段结果作为训练语料集训练得到分段模型;将所述待抽取文档输入至所述分段模型中,得到多个文档段落。5.如权利要求1所述的人物关系抽取方法,其特征在于,所述获取与所述三元组匹配的训练文本,包括:构建包含多...
【专利技术属性】
技术研发人员:洪丰,黄敏,周伟杰,熊善良,蔡文笔,韦有朋,
申请(专利权)人:北京海卓飞网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。