The invention relates to an optimization method of edge weight in knowledge atlas, which includes: defining knowledge atlas, which includes the original edge weights of nodes, directed edges between nodes and directed edges; receiving query information from users; searching candidate answers of corresponding query information, and sorting candidate answers by knowledge atlas. And push it to users; receive feedback information from users on candidate answers after sorting; construct symbolic geometric programming problem, the constraint function of symbolic geometric programming problem is set based on feedback information, and the objective function of symbolic geometric programming problem is the function of optimizing edge weight; solve symbolic geometric programming problem to obtain optimizing edge weight. It's heavy. The method transforms the optimization problem of edge weight of knowledge map into a symbolic geometric programming problem by using user feedback information, which can improve the accuracy of edge weight and the quality of knowledge map efficiently and automatically. The invention also relates to an optimization device, medium, equipment and system for edge weight in knowledge map.
【技术实现步骤摘要】
知识图谱中边权重的优化方法、装置、介质、设备及系统
本专利技术涉及知识图谱优化领域,具体涉及一种知识图谱中边权重的优化方法、装置、介质、设备及系统。
技术介绍
在现代社会中,知识图谱已被广泛应用于各种应用中,如问答系统(Q&A)系统、推荐系统、网络搜索引擎和精密医学等。例如,基于知识图谱来计算问题和帮助文档之间的相似度,已被证明是有效的找到最佳文档答案的方法。在知识图谱中,边(edge)代表了两个实体节点之间的关联信息,并且关联的强度通常由边的权重来表示。边权重的信息能够在知识图谱应用中表现出很高的价值。例如,在一个技术支持问答系统的应用中,“电脑死机”问题尝尝是由“内存不足”造成的,那么这两个实体之间关联边的权重应该更大,使得当用户询问电脑死机时,更将内存不足及其相关解决办法推荐给用户。再例如,在一个基于医疗知识图谱的诊断应用中,多个病可能导致同一个症状,但他们之间的边权重应该是不同的,这样能够帮助系统进行更加精确的诊断。显然,如何设置边的权重是知识图谱的构造和维护的关键挑战。现有的确定知识图谱中边权重的方法主要基于两个实体之间的直接关联关系(例如网页之间的超链接)或利用两个实体之间相关的统计信息。然而,这些方法很容易受到源数据本身存在的错误或统计错误的影响,导致边权重的准确度以及知识图谱的质量低下。
技术实现思路
为了解决上述全部或部分问题,本专利技术提供一种知识图谱中边权重的优化方法、装置、介质、设备以及系统。本专利技术的实施方式公开了一种知识图谱中边权重的优化方法,该方法包括定义知识图谱,知识图谱包括节点、节点之间的有向边以及有向边的原始边权重 ...
【技术保护点】
1.一种知识图谱中边权重的优化方法,其特征在于,所述方法包括:定义知识图谱,所述知识图谱包括节点、所述节点之间的有向边以及所述有向边的原始边权重;从用户接收查询信息;搜索对应所述查询信息的候选答案,利用所述知识图谱对所述候选答案进行排序,并将所述排序后的候选答案推送给所述用户;从所述用户接收对所述排序后的候选答案的反馈信息;构建符号几何规划问题,所述符号几何规划问题的约束函数基于所述反馈信息设定,所述符号几何规划问题的目标函数为优化边权重的函数;求解所述符号几何规划问题得到所述优化边权重。
【技术特征摘要】
1.一种知识图谱中边权重的优化方法,其特征在于,所述方法包括:定义知识图谱,所述知识图谱包括节点、所述节点之间的有向边以及所述有向边的原始边权重;从用户接收查询信息;搜索对应所述查询信息的候选答案,利用所述知识图谱对所述候选答案进行排序,并将所述排序后的候选答案推送给所述用户;从所述用户接收对所述排序后的候选答案的反馈信息;构建符号几何规划问题,所述符号几何规划问题的约束函数基于所述反馈信息设定,所述符号几何规划问题的目标函数为优化边权重的函数;求解所述符号几何规划问题得到所述优化边权重。2.根据权利要求1所述的方法,其特征在于,利用所述知识图谱对所述候选答案进行排序包括:将所述查询信息映射到所述知识图谱上得到查询节点;将所述候选答案映射到所述知识图谱上得到候选答案节点;计算所述查询节点与所述候选答案节点之间的相似度;将所述候选答案按照所述相似度的降序进行排列。3.根据权利要求2所述的方法,其特征在于,所述查询节点与所述候选答案节点之间的所述相似度通过以下计算:其中,φ(vq,va)表示所述查询节点vq与所述候选答案节点va之间的所述相似度,z:表示从所述查询节点vq到所述候选答案节点va跳数小于阈值的路径,|z|表示路径z的长度,P[z]为路径z的概率,c为常数参数,w(vi,vi+1)表示所述知识图谱中的vi节点指向vi+1节点的边权重,w(vq,v1)表示所述查询节点vq指向所述知识图谱中的v1节点的边权重,w(vk,va)表示所述知识图谱中的vk节点指向所述候选答案节点va的边权重。4.根据权利要求2所述的方法,其特征在于,所述反馈信息包括所述用户从所述排序后的候选答案中选择的最佳答案;所述约束函数为所述最佳答案对应的最佳答案节点与所述查询节点之间的所述相似度大于其他所述候选答案节点与所述查询节点之间的所述相似度;所述目标函数为使得各所述有向边的边权重变化量的平方和最小,每条所述有向边的边权重变化量为该条所述有向边的所述优化边权重与所述原始边权重之差。5.根据权利要求2所述的方法,其特征在于,所述方法还包括:对所述反馈信息进行聚类处理得到多个聚类;按照融合规则融合各个所述聚类对应的所述优化边权重得到最终的所述优化边权重,每个所述聚类对应的所述优化边权重通过求解基于该所述聚类包含的所述反馈信息构建的所述符号几何规划问题而获得。6.根据权利要求5所述的方法,其特征在于,基于所述反馈信息涉及的所述有向边的集合对所述反馈信息进行聚类处理,所述反馈信息涉及的所述有向边的集合为从所述反馈信息涉及的所述查询节点到所述反馈信息涉及的各所述候选答案节点跳数小于阈值的所有路径经过的所述有向边的集合。7.根据权利要求5所述的方法,其特征在于,所述融合规则为,对于一条所述有向边,如果只存在对应一个所述聚类的一个所述优化边权重,则将其作为该条所述有向边的所述优化边权重;如果存在对应多个所述聚类的多个所述优化边权重,并且所述多个优化边权重均大于该条所述有向边的所述原始边权重,则将使得该条所述有向边的边权重增加量最大的所述优化边权重作为该条所述有向边的所述优化边权重;如果存在对应多个所述聚类的多个所述优化边权重,并且所述多个优化边权重均小于该条所述有向边的所述原始边权重,则将...
【专利技术属性】
技术研发人员:杨燕,杨瑞达,贺樑,
申请(专利权)人:华东师范大学,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。