一种知识图谱构建、信息检索方法、装置、设备及介质制造方法及图纸

技术编号:37158903 阅读:29 留言:0更新日期:2023-04-06 22:22
本公开提供了一种知识图谱构建、信息检索方法、装置、设备及介质,涉及数据处理技术领域,尤其涉及信息检索技术领域。具体实现方案为:对文本进行语义分析,获得上述文本描述的人物关联事件的事件类别;对上述文本进行实体识别,得到针对人物的目标实体以及目标实体的实体属性;基于上述事件类别,确定实体间关系的候选关系模式;基于上述候选关系模式、目标实体、实体属性以及目标实体所属的目标文本单元,确定目标实体之间的实体关系;根据目标实体以及实体关系,构建知识图谱。应用本公开实施例提供的方法构建得到的知识图谱进行信息检索,能够提高信息检索的效率。能够提高信息检索的效率。能够提高信息检索的效率。

【技术实现步骤摘要】
一种知识图谱构建、信息检索方法、装置、设备及介质


[0001]本公开涉及数据处理
,尤其涉及信息检索


技术介绍

[0002]目前,互联网中的各类信息正呈指数级增长,其中包含海量与人物相关的信息,如人物的职位信息、活动出席信息、任免信息等,用户很多情况下会想要了解针对人物的各种信息。可见,人物信息检索是日常生活中的常见需求。
[0003]现有技术中,一般会基于文字检索的方式进行人物信息检索。例如,基于与人物相关的文本信息构建人物信息库,在用户有检索需求时,基于用户输入的检索文本在人物信息库中进行检索,得到最终的检索结果。其中,为了保证检索结果的实时性和准确度,上述人物信息库需要不断的进行人为更新。

技术实现思路

[0004]本公开提供了一种知识图谱构建、信息检索方法、装置、设备及介质。
[0005]根据本公开的一方面,提供了一种知识图谱构建方法,包括:
[0006]对文本进行语义分析,获得所述文本描述的人物关联事件的事件类别;
[0007]对所述文本进行实体识别,得到针对人物的目标实本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种知识图谱构建方法,包括:对文本进行语义分析,获得所述文本描述的人物关联事件的事件类别;对所述文本进行实体识别,得到针对人物的目标实体以及目标实体的实体属性;基于所述事件类别,确定实体间关系的候选关系模式;基于所述候选关系模式、目标实体、实体属性以及目标实体所属的目标文本单元,确定目标实体之间的实体关系;根据目标实体以及实体关系,构建知识图谱。2.根据权利要求1所述的方法,其中,所述基于所述候选关系模式、目标实体、实体属性所述目标实体所属的目标文本单元,确定所述实体目标实体之间的实体关系,包括:获得目标实体所属的目标文本单元中除目标实体和实体属性外的目标字符;基于所获得的目标字符,确定所述候选关系模式下目标实体中的关系主体和关系客体;基于所述关系主体、关系客体和所述候选关系模式,生成目标实体之间的实体关系。3.根据权利要求1所述的方法,其中,所述对所述文本进行实体识别,得到针对人物的目标实体以及目标实体的实体属性,包括:对所述文本划分,得到疑似包括实体的文本单元;对得到的文本单元进行分词处理,基于得到的分词识别目标实体以及目标实体的实体属性。4.根据权利要求3所述的方法,其中,所述对所述文本划分,得到疑似包括实体的文本单元,包括:对所述文本进行划分,得到所述文本包括的候选文本单元;确定候选文本单元中不存在实体的非实体文本单元;将候选文本单元中除非实体文本单元外的文本单元确定为疑似包括实体的文本单元。5.根据权利要求3所述的方法,其中,所述基于得到的分词识别目标实体以及目标实体的实体属性,包括:基于得到的分词的词性和得到的分词在得到的文本单元中的上下文语义,识别得到的文本单元中目标实体的边界以及目标实体的实体属性的边界;基于识别到的目标实体的边界以及实体属性的边界,确定得到的文本单元中包含的目标实体以及目标实体的实体属性。6.根据权利要求1

5中任一项所述的方法,其中,所述对文本进行语义分析,获得所述文本描述的人物关联事件的事件类别,包括:对文本进行分词处理,并对所得分词进行向量化处理,得到分词向量;根据得到的分词向量,预测所述文本描述的人物关联事件属于预设的人物关联事件的类别的概率;基于预测得到的概率,从预设的任务关联事件的类别中,获得所述文本描述的人物关联事件的事件类别。7.一种信息检索方法,包括:对检索文本进行分词处理;从得到的分词中,确定所述检索文本中包括的检索人物以及针对所述检索人物的检索
意图;基于所述检索人物以及检索意图,采用图游走的方式在知识图谱中进行检索,得到针对所述检索人物的检索结果,其中,所述知识图谱为:根据权利要求1

6中任一项构建的知识图谱。8.根据权利要求7所述的方法,其中,所述基于所述检索人物以及检索意图,采用图游走的方式在知识图谱中进行检索,得到针对所述检索人物的检索结果,包括:从所述知识图谱中确定以所述检索人物为实体的检索起始节点;确定所述检索起始节点的出边;基于确定出的出边表征的实体关系,从确定出的出边中选择所述检索意图对应的目标出边;基于所述目标出边指向的目标节点表征的实体,获得针对所述检索人物的检索结果。9.一种知识图谱构建装置,包括:事件类别获得模块,用于对文本进行语义分析,获得所述文本描述的人物关联事件的事件类别;实体识别模块,用于对所述文本进行实体识别,得到针对人物的目标实体以及目标实体的实体属性;候选关系模式确定模块,用于基于所述事件类别,确...

【专利技术属性】
技术研发人员:吕涛
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1