【技术实现步骤摘要】
关系强度确定方法和装置
本专利技术涉及数据挖掘
,特别涉及一种关系强度确定方法和装置。
技术介绍
随着信息技术的发展,人、机构、事件等实体之间的关系变得越来越复杂。如何从大量数据中挖掘出实体之间的关系,成为研究的热点问题。专利技术人了解到的相关技术包括:如果两个实体间存在例如父子、朋友、同事等的直接关系,根据这两个实体间的例如通话次数和通话时间等行为信息,计算这两个实体间的直接关系强度。根据最短路径算法,计算存在间接关系的两个实体间的间接关系强度。
技术实现思路
专利技术人发现,相关技术要么无法反映实体间隐含的关系及其强度,要么隐含关系强度由于根据一条路径产生导致比较片面。本专利技术实施例所要解决的一个技术问题是:挖掘实体间的隐含关系,并且综合地度量实体间的关系强度。根据本专利技术的一个方面,提出一种关系强度确定方法,包括:在实体关系图的任意一个连通子图中,游走点从初始点开始随机游走,并随机游走预设次数,所述实体关系图中的点表示实体,边表示实体之间的直接关系,边的权值表示实体之间直接关系的强度;根据随机游走次数以及每次随机游走过程中游走点在目标点停留的次数,确定 ...
【技术保护点】
一种关系强度确定方法,包括:在实体关系图的任意一个连通子图中,游走点从初始点开始随机游走,并随机游走预设次数,所述实体关系图中的点表示实体,边表示实体之间的直接关系,边的权值表示实体之间直接关系的强度;根据随机游走次数以及每次随机游走过程中游走点在目标点停留的次数,确定初始点与目标点之间的综合关系强度。
【技术特征摘要】
1.一种关系强度确定方法,包括:在实体关系图的任意一个连通子图中,游走点从初始点开始随机游走,并随机游走预设次数,所述实体关系图中的点表示实体,边表示实体之间的直接关系,边的权值表示实体之间直接关系的强度;根据随机游走次数以及每次随机游走过程中游走点在目标点停留的次数,确定初始点与目标点之间的综合关系强度。2.如权利要求1所述的方法,其中,一次随机游走过程包括:当游走步数不大于预设的最大游走步数时,根据当前点所附着的边的权值,计算从当前点选择当前点所附着的每个边的概率;将当前点所附着的每个边顺序映射到预设区间内的一个子区间上,子区间的长度等于边对应的概率;从所述预设区间中取一个随机数,选择所述随机数所在的子区间对应的边,游走点从当前点移动到被选中边的另一端,游走步数加1;重复前述随机游走过程,直至游走步数大于预设的最大游走步数,一次随机游走过程结束。3.如权利要求2所述的方法,其中,从当前点选择当前点所附着的每个边的概率为:当前点所附着的每个边的权值与当前点所附着的所有边的权值和之间的比值。4.如权利要求2所述的方法,其中,所述最大游走步数根据所述连通子图中边的数量确定。5.如权利要求1所述的方法,其中,所述实体关系图中的点包括一个指向点自身的边,所述指向点自身的边的权值为:该点所附着的所有边的权值的平均值。6.如权利要求1所述的方法,其中,所述随机游走次数根据所述连通子图中节点的数量确定;或者,初始点与目标点之间的综合关系强度为:根据随机游走次数以及每次随机游走过程中游走点在目标点停留的次数所确定的随机游走过程中游走点在目标点停留次数的均值。7.一种关系强度确定装置,包括:随机游走模块,用于在实体关系图的任意一个连通子图中,游走点从初始点开始随机游走,并随机游走预设次数,所述实...
【专利技术属性】
技术研发人员:束博,
申请(专利权)人:北京天广汇通科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。