知识图谱中边权重的优化方法、装置、介质、设备及系统制造方法及图纸

技术编号:19388891 阅读:33 留言:0更新日期:2018-11-10 02:01
本发明专利技术涉及一种知识图谱中边权重的优化方法,包括:定义知识图谱,知识图谱包括节点、节点之间的有向边以及有向边的原始边权重;从用户接收查询信息;搜索对应查询信息的候选答案,利用知识图谱对候选答案进行排序并推送给用户;从用户接收对排序后的候选答案的反馈信息;构建符号几何规划问题,符号几何规划问题的约束函数基于反馈信息设定,符号几何规划问题的目标函数为优化边权重的函数;求解符号几何规划问题得到优化边权重。本发明专利技术利用用户的反馈信息将知识图谱的边权重优化问题转化成一个符号几何规划问题,能够高效地自动化地提高边权重的准确度以及知识图谱的质量。本发明专利技术还涉及一种知识图谱中边权重的优化装置、介质、设备及系统。

Optimization method, device, medium, equipment and system of edge weight in knowledge map

The invention relates to an optimization method of edge weight in knowledge atlas, which includes: defining knowledge atlas, which includes the original edge weights of nodes, directed edges between nodes and directed edges; receiving query information from users; searching candidate answers of corresponding query information, and sorting candidate answers by knowledge atlas. And push it to users; receive feedback information from users on candidate answers after sorting; construct symbolic geometric programming problem, the constraint function of symbolic geometric programming problem is set based on feedback information, and the objective function of symbolic geometric programming problem is the function of optimizing edge weight; solve symbolic geometric programming problem to obtain optimizing edge weight. It's heavy. The method transforms the optimization problem of edge weight of knowledge map into a symbolic geometric programming problem by using user feedback information, which can improve the accuracy of edge weight and the quality of knowledge map efficiently and automatically. The invention also relates to an optimization device, medium, equipment and system for edge weight in knowledge map.

【技术实现步骤摘要】
知识图谱中边权重的优化方法、装置、介质、设备及系统
本专利技术涉及知识图谱优化领域,具体涉及一种知识图谱中边权重的优化方法、装置、介质、设备及系统。
技术介绍
在现代社会中,知识图谱已被广泛应用于各种应用中,如问答系统(Q&A)系统、推荐系统、网络搜索引擎和精密医学等。例如,基于知识图谱来计算问题和帮助文档之间的相似度,已被证明是有效的找到最佳文档答案的方法。在知识图谱中,边(edge)代表了两个实体节点之间的关联信息,并且关联的强度通常由边的权重来表示。边权重的信息能够在知识图谱应用中表现出很高的价值。例如,在一个技术支持问答系统的应用中,“电脑死机”问题尝尝是由“内存不足”造成的,那么这两个实体之间关联边的权重应该更大,使得当用户询问电脑死机时,更将内存不足及其相关解决办法推荐给用户。再例如,在一个基于医疗知识图谱的诊断应用中,多个病可能导致同一个症状,但他们之间的边权重应该是不同的,这样能够帮助系统进行更加精确的诊断。显然,如何设置边的权重是知识图谱的构造和维护的关键挑战。现有的确定知识图谱中边权重的方法主要基于两个实体之间的直接关联关系(例如网页之间的超链接)或利用两个实体之间相关的统计信息。然而,这些方法很容易受到源数据本身存在的错误或统计错误的影响,导致边权重的准确度以及知识图谱的质量低下。
技术实现思路
为了解决上述全部或部分问题,本专利技术提供一种知识图谱中边权重的优化方法、装置、介质、设备以及系统。本专利技术的实施方式公开了一种知识图谱中边权重的优化方法,该方法包括定义知识图谱,知识图谱包括节点、节点之间的有向边以及有向边的原始边权重;从用户接收查询信息;搜索对应查询信息的候选答案,利用知识图谱对候选答案进行排序,并将排序后的候选答案推送给用户;从用户接收对排序后的候选答案的反馈信息;构建符号几何规划问题,符号几何规划问题的约束函数基于反馈信息设定,符号几何规划问题的目标函数为优化边权重的函数;求解符号几何规划问题得到优化边权重。在一示范例中,利用知识图谱对候选答案进行排序包括:将查询信息映射到知识图谱上得到查询节点;将候选答案映射到知识图谱上得到候选答案节点;计算查询节点与候选答案节点之间的相似度;将候选答案按照相似度的降序进行排列。在一示范例中,查询节点与候选答案节点之间的相似度通过以下计算:其中,φ(vq,va)表示查询节点vq与候选答案节点va之间的相似度,z:表示从查询节点vq到候选答案节点va跳数小于阈值的路径,|z|表示路径z的长度,P[z]为路径z的概率,c为常数参数,w(vi,vi+1)表示知识图谱中的vi节点指向vi+1节点的边权重,w(vq,v1)表示查询节点vq指向知识图谱中的v1节点的边权重,w(vk,va)表示知识图谱中的vk节点指向候选答案节点va的边权重。在一示范例中,反馈信息包括用户从排序后的候选答案中选择的最佳答案;约束函数为最佳答案对应的最佳答案节点与查询节点之间的相似度大于其他候选答案节点与查询节点之间的相似度;目标函数为使得各有向边的边权重变化量的平方和最小,每条有向边的边权重变化量为该条有向边的优化边权重与原始边权重之差。在一示范例中,该方法还包括:对反馈信息进行聚类处理得到多个聚类;按照融合规则融合各个聚类对应的优化边权重得到最终的优化边权重,每个聚类对应的优化边权重通过求解基于该聚类包含的反馈信息构建的符号几何规划问题而获得。在一示范例中,基于反馈信息涉及的有向边的集合对反馈信息进行聚类处理,反馈信息涉及的有向边的集合为从反馈信息涉及的查询节点到反馈信息涉及的各候选答案节点跳数小于阈值的所有路径经过的有向边的集合。在一示范例中,融合规则为,对于一条有向边,如果只存在对应一个聚类的一个优化边权重,则将其作为该条有向边的优化边权重;如果存在对应多个聚类的多个优化边权重,并且多个优化边权重均大于该条有向边的原始边权重,则将使得该条有向边的边权重增加量最大的优化边权重作为该条有向边的优化边权重;如果存在对应多个聚类的多个优化边权重,并且多个优化边权重均小于该条有向边的原始边权重,则将使得该条有向边的边权重减少量最大的优化边权重作为该条有向边的优化边权重;如果存在对应多个聚类的多个优化边权重,并且仅有部分优化边权重大于该条有向边的原始边权重,则计算该条有向边的边权重变化量的加权平均值并且权重为各个聚类包含的反馈信息的个数,若加权平均值为正,那么将使得该条有向边的边权重增加量最大的优化边权重作为该条有向边的优化边权重,若加权平均值为负,那么将使得该条有向边的边权重减少量最大的优化边权重作为该条有向边的优化边权重。在一示范例中,利用文本相似度的计算方法,从语料库中搜索对应查询信息的候选答案。本专利技术的实施方式还公开了一种知识图谱中边权重的优化装置,该装置包括:知识图谱定义模块,定义知识图谱,知识图谱包括节点、节点之间的有向边以及有向边的原始边权重;查询信息接收模块,从用户接收查询信息;候选答案推送模块,搜索对应查询信息的候选答案,利用知识图谱对候选答案进行排序,并将排序后的候选答案推送给用户;反馈信息接收模块,从用户接收对排序后的候选答案的反馈信息;符号几何规划问题构建模块,构建符号几何规划问题,符号几何规划问题的约束函数基于反馈信息设定,符号几何规划问题的目标函数为优化边权重的函数;符号几何规划问题求解模块,求解符号几何规划问题得到优化边权重。本专利技术的实施方式还公开了一种非易失性存储介质,在存储介质上存储有知识图谱中边权重的优化程序,知识图谱中边权重的优化程序被计算机执行以实施知识图谱中边权重的优化方法,该程序包括:知识图谱定义指令,定义知识图谱,知识图谱包括节点、节点之间的有向边以及有向边的原始边权重;查询信息接收指令,从用户接收查询信息;候选答案推送指令,搜索对应查询信息的候选答案,利用知识图谱对候选答案进行排序,并将排序后的候选答案推送给用户;反馈信息接收指令,从用户接收对排序后的候选答案的反馈信息;符号几何规划问题构建指令,构建符号几何规划问题,符号几何规划问题的约束函数基于反馈信息设定,符号几何规划问题的目标函数为优化边权重的函数;符号几何规划问题求解指令,求解符号几何规划问题得到优化边权重。本专利技术的实施方式还公开了一种知识图谱中边权重的优化设备,包括:存储器,存储有计算机可以执行的知识图谱中边权重的优化程序;以及处理器,连接至存储器,并且被配置为执行知识图谱中边权重的优化程序以:定义知识图谱,知识图谱包括节点、节点之间的有向边以及有向边的原始边权重;从用户接收查询信息;搜索对应查询信息的候选答案,利用知识图谱对候选答案进行排序,并将排序后的候选答案推送给用户;从用户接收对排序后的候选答案的反馈信息;构建符号几何规划问题,符号几何规划问题的约束函数基于反馈信息设定,符号几何规划问题的目标函数为优化边权重的函数;求解符号几何规划问题得到优化边权重。本专利技术的实施方式还公开了一种系统,包括如上所述的知识图谱中边权重的优化装置。本专利技术实施方式与现有技术相比,主要区别及其效果在于:利用用户的反馈信息将知识图谱的边权重优化问题转化成一个符号几何规划问题,能够高效地自动化地提高边权重的准确度以及知识图谱的质量。附图说明图1为根据本专利技术实施方式的知识本文档来自技高网...

【技术保护点】
1.一种知识图谱中边权重的优化方法,其特征在于,所述方法包括:定义知识图谱,所述知识图谱包括节点、所述节点之间的有向边以及所述有向边的原始边权重;从用户接收查询信息;搜索对应所述查询信息的候选答案,利用所述知识图谱对所述候选答案进行排序,并将所述排序后的候选答案推送给所述用户;从所述用户接收对所述排序后的候选答案的反馈信息;构建符号几何规划问题,所述符号几何规划问题的约束函数基于所述反馈信息设定,所述符号几何规划问题的目标函数为优化边权重的函数;求解所述符号几何规划问题得到所述优化边权重。

【技术特征摘要】
1.一种知识图谱中边权重的优化方法,其特征在于,所述方法包括:定义知识图谱,所述知识图谱包括节点、所述节点之间的有向边以及所述有向边的原始边权重;从用户接收查询信息;搜索对应所述查询信息的候选答案,利用所述知识图谱对所述候选答案进行排序,并将所述排序后的候选答案推送给所述用户;从所述用户接收对所述排序后的候选答案的反馈信息;构建符号几何规划问题,所述符号几何规划问题的约束函数基于所述反馈信息设定,所述符号几何规划问题的目标函数为优化边权重的函数;求解所述符号几何规划问题得到所述优化边权重。2.根据权利要求1所述的方法,其特征在于,利用所述知识图谱对所述候选答案进行排序包括:将所述查询信息映射到所述知识图谱上得到查询节点;将所述候选答案映射到所述知识图谱上得到候选答案节点;计算所述查询节点与所述候选答案节点之间的相似度;将所述候选答案按照所述相似度的降序进行排列。3.根据权利要求2所述的方法,其特征在于,所述查询节点与所述候选答案节点之间的所述相似度通过以下计算:其中,φ(vq,va)表示所述查询节点vq与所述候选答案节点va之间的所述相似度,z:表示从所述查询节点vq到所述候选答案节点va跳数小于阈值的路径,|z|表示路径z的长度,P[z]为路径z的概率,c为常数参数,w(vi,vi+1)表示所述知识图谱中的vi节点指向vi+1节点的边权重,w(vq,v1)表示所述查询节点vq指向所述知识图谱中的v1节点的边权重,w(vk,va)表示所述知识图谱中的vk节点指向所述候选答案节点va的边权重。4.根据权利要求2所述的方法,其特征在于,所述反馈信息包括所述用户从所述排序后的候选答案中选择的最佳答案;所述约束函数为所述最佳答案对应的最佳答案节点与所述查询节点之间的所述相似度大于其他所述候选答案节点与所述查询节点之间的所述相似度;所述目标函数为使得各所述有向边的边权重变化量的平方和最小,每条所述有向边的边权重变化量为该条所述有向边的所述优化边权重与所述原始边权重之差。5.根据权利要求2所述的方法,其特征在于,所述方法还包括:对所述反馈信息进行聚类处理得到多个聚类;按照融合规则融合各个所述聚类对应的所述优化边权重得到最终的所述优化边权重,每个所述聚类对应的所述优化边权重通过求解基于该所述聚类包含的所述反馈信息构建的所述符号几何规划问题而获得。6.根据权利要求5所述的方法,其特征在于,基于所述反馈信息涉及的所述有向边的集合对所述反馈信息进行聚类处理,所述反馈信息涉及的所述有向边的集合为从所述反馈信息涉及的所述查询节点到所述反馈信息涉及的各所述候选答案节点跳数小于阈值的所有路径经过的所述有向边的集合。7.根据权利要求5所述的方法,其特征在于,所述融合规则为,对于一条所述有向边,如果只存在对应一个所述聚类的一个所述优化边权重,则将其作为该条所述有向边的所述优化边权重;如果存在对应多个所述聚类的多个所述优化边权重,并且所述多个优化边权重均大于该条所述有向边的所述原始边权重,则将使得该条所述有向边的边权重增加量最大的所述优化边权重作为该条所述有向边的所述优化边权重;如果存在对应多个所述聚类的多个所述优化边权重,并且所述多个优化边权重均小于该条所述有向边的所述原始边权重,则将...

【专利技术属性】
技术研发人员:杨燕杨瑞达贺樑
申请(专利权)人:华东师范大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1