【技术实现步骤摘要】
信息检索方法、装置、电子设备和存储介质
[0001]本公开涉及计算机
,具体涉及自然语言处理、知识图谱等人工智能
,尤其涉及一种信息检索方法、装置、电子设备和存储介质。
技术介绍
[0002]随着计算机技术的蓬勃发展,深度学习、自然语言处理、知识图谱等领域也得到了迅速发展,知识推理技术应用的也越来越广泛。比如,在检索领域,在数据库中不存在与检索语句匹配的检索结果的情况下,通常需要利用知识推理,来获得准确的检索结果。
[0003]检索领域的相关技术中,知识推理的可靠性和准确性,主要依赖于结构化知识库,但是结构化知识库获取的复杂度及成本较高。因此,如果提高检索的准确性和可靠性,成为目前亟需解决的问题。
技术实现思路
[0004]本公开提供了一种信息检索方法、装置、电子设备和存储介质。
[0005]本公开一方面,提供了一种信息检索方法,包括:
[0006]确定检索语句对应的目标检索词;
[0007]基于所述目标检索词对预设的知识图谱进行检索,以获取与所述目标检索词关联的候 ...
【技术保护点】
【技术特征摘要】
1.一种信息检索方法,包括:确定检索语句对应的目标检索词;基于所述目标检索词对预设的知识图谱进行检索,以获取与所述目标检索词关联的候选三元组;根据每个候选三元组与所述目标检索词的匹配度及每个所述候选三元组对应的知识类型,确定每个所述候选三元组的权重;根据每个所述候选三元组的权重,对所述目标检索词进行更新;基于更新后的目标检索词,确定目标检索结果。2.如权利要求1所述的方法,其中,所述确定检索语句对应的目标检索词,包括:对获取的检索语句进行预处理,以确定所述检索语句对应的主实体信息、目标实体信息及核心关键词;根据所述主实体信息、目标实体信息及核心关键词,确定所述检索语句对应的目标检索词。3.如权利要求2所述的方法,其中,所述主实体信息,包括以下至少一项:主实体标识及主实体的类型;所述目标实体信息,包括以下至少一项:目标实体标识及目标实体的类型。4.如权利要求3所述的方法,其中,所述根据所述主实体信息、目标实体信息及核心关键词,确定所述检索语句对应的目标检索词,包括:在所述目标实体信息中类型为概念类的情况下,根据所述核心关键词及所述主实体信息中的标识,确定所述目标检索词;或者,在所述目标实体信息中类型为非概念类的情况下,根据所述主实体信息中的标识及所述目标实体信息中的标识,确定所述目标检索词。5.如权利要求1所述的方法,其中,在所述基于所述目标检索词对预设的知识图谱进行检索之前,还包括:确定所述检索语句对应的主实体及候选答案实体;从预设的知识图谱库中搜索由所述主实体至每个所述候选答案实体之间的每条路径;基于所述每条路径,生成所述预设的知识图谱。6.如权利要求1所述的方法,其中,所述根据每个候选三元组与所述目标检索词的匹配度及每个所述候选三元组对应的知识类型,确定每个所述候选三元组的权重,包括:确定所述预设的知识图谱中包含的任一候选三元组的路径的数量、及所述任一候选三元组中的文本来源;根据所述包含任一候选三元组的路径的数量、所述任一候选三元组中的文本来源、及所述任一候选三元组与所述目标检索词的匹配度,确定所述任一候选三元组的初始权重;根据与所述任一候选三元组的知识类型相同的其余候选三元组间与所述任一候选三元组的关联关系,确定所述任一候选三元组对应的关联权重;根据所述初始权重及所述关联权重,确定所述任一候选三元组的权重。7.如权利要求6所述的方法,其中,所述根据与所述任一候选三元组的知识类型相同的其余候选三元组间与所述任一候选三元组的关联关系,确定所述任一候选三元组对应的关联权重,包括:
若第一候选三元组中的知识类型的取值为所述任一候选三元组中的知识类型的取值的子集,则确定所述任一候选三元组对应的关联权重中包含所述第一候选三元组对应的初始权重。8.如权利要求6所述的方法,其中,所述根据每个所述候选三元组的权重,对所述目标检索词进行更新,包括:将权重大于阈值的任一候选三元组中的实体与所述目标检索词进行组合,以生成新的目标检索词。9.如权利要求1
‑
8任一所述的方法,其中,所述基于更新后的目标检索词,确定目标检索结果,包括:基于所述更新后的目标检索词,对实体键值对库进行检索,在所述实体键值对库中包含与所述更新后的目标检索词对应的目标实体的情况下,将所述目标实体确认为目标检索结果;在所述实体键值对库中未包含与所述更新后的目标检索词对应的目标实体的情况下,基于所述更新后的目标检索词对所述预设的知识图谱进行检索,以确定与所述更新后的目标检索词对应的目标检索结果。10.如权利要求1
‑
8任一所述的方法,其中,在所述基于更新后的目标检索词,确定目标检索结果之后,还包括:获取与所述更新后的目标检索词对应的历史搜索结果展现页数据;确定所述目标搜索结果在所述历史搜索结果展现页中的出现频次;根据所述出现频次及所述历史搜索结果展现页数据中的搜索结果操作数据,确定所述目标搜索结果的置信度;在所述置信度大于阈值的情况下,在搜索结果展现页中展现所述目标搜索结果。11.一种信息检索装置,包括:第一确定模块,用于确定检索语句对应的目标检索词;获取模块,用于基于所述目标检索词对预设的知识图谱进行检索,以获取与所述目标检索词关联的候选三元组;第二确定模块,用于根据每个候选三...
【专利技术属性】
技术研发人员:朱嘉琪,卢佳俊,柴春光,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。