当前位置: 首页 > 专利查询>清华大学专利>正文

基于时间跨度优化的短时社区搜索方法技术

技术编号:30145809 阅读:61 留言:0更新日期:2021-09-23 15:20
本公开提供一种基于时间跨度优化的短时社区搜索方法,包括:获取用户的查询需求;查询需求包括:用来约束社区的子图拓扑结构特征,预设返回短时社区的数量和网络中需要的查询节点;根据查询需求计算网络中的全局时间跨度上限,获取最大子图;在最大子图的范围内找到查询节点所在的集合,获取查询节点的最小短时社区;将最小短时社区向外扩展且不超过最大子图,将满足条件的社区纳入短时社区集合;判断当前短时社区集合中社区的数量是否达到查询需求预设返回短时社区的数量:若是,则输出短时社区集合;若否,则继续将短时社区向外扩展,将满足条件的社区纳入短时社区集合再次进行判断。本公开可以有效解决推荐系统中对用户社区的时效性需求。区的时效性需求。区的时效性需求。

【技术实现步骤摘要】
【国外来华专利技术】基于时间跨度优化的短时社区搜索方法


[0001]本公开涉及社区搜索
,特别涉及一种基于时间跨度优化的短时社区搜索方法。

技术介绍

[0002]随着互联网的不断发展,用户规模也在逐年增加。近十几年来,越来越多的用户习惯于在网络上进行交友,浏览,购物等活动。由于互联网上数据量的不断增加,用户很难直接在庞大的数据中找到适合自己的内容。因此,如何结合海量数据挖掘用户行为是推荐技术中的重点研究问题之一。其中,用户社区推荐作为推荐技术中的关键任务,近年来在学术界和工业界也受到越来越多的关注。
[0003]在用户社区推荐方面,其目的是在网络中找到与查询用户相似成员所构成的社区。例如在短视频平台,用户常常会在平台中浏览喜爱的视频。尽管不同用户偏好不同,随着用户量的不断增加可以找到其他与之观看视频类别相类似的用户群体。由于这些用户往往具有一定程度的相似性,通过找到这部分用户群体,有助于发现用户兴趣爱好,引导用户加入到感兴趣的社区中。然而,尽管社区是社交网络的一个重要属性,但是社区这一概念尚无统一的形式化定义。通常,社区具有社区内节点连接较为紧密,社区间节点连接较为松散的特点。因此,如何挖掘社交网络图数据中的社区结构是近年来的研究热点。
[0004]研究者可以借助社区结构进行大量实际应用,例如社交网络中基于条件的社区发现,基于社区结构优化子图匹配,层次化社区发现以及利用网络上的时序属性进行社区搜索等。近几年中,网络图数据的时序性逐渐受到学者关注。在时序网络中,节点间的边具有时间属性,代表两个节点在某一或某些时刻(即时间戳)产生关联。在时序图中存在许多与时序性相关的社区搜索问题,例如在时序动物行为网络中寻找周期性出现的动物路线以探寻周期性的迁徙现象,或者在时序社交网络中找出在任意一个固定长度的子区间中都能满足拓扑约束的时序紧密型社区。
[0005]在推荐场景下的社区推荐往往具有时效性要求。通常情况下,用户兴趣可以分为长期兴趣和短期兴趣两类。长期兴趣是用户稳定的兴趣爱好,其特点是在较长时间段内用户的兴趣爱好不会发生变化。而短期兴趣往往由平台中的话题、活动等突发事件引起,用户对此的兴趣往往随着话题、活动的结束而快速消失。时效性对应用户的短时兴趣,通过找到近期内活跃的社区,平台既可以为用户提供共同讨论圈,又可以通过这些社区挖掘近期活跃内容。目前已有社区搜索算法尚未考虑到建模用户短期兴趣的社区结构,此时应用已有算法无法保证找到的社区满足时效性需求。大多数社区搜索算法返回的社区中,用户交互时间差异较大,因而不能用于解决推荐场景下的社区推荐问题。
[0006]针对上述在社区推荐中尚存的问题,本专利技术提出了基于时间跨度优化的短时社区搜索方法,通过分析时序社交网络用户交互的特点,提出了带有时间约束的社区结构并进一步提出了相应的社区搜索方法以返回具有时效性的社区。

技术实现思路

[0007]本公开实施例所要解决的一个技术问题是:提供一种基于时间跨度优化的短时社区搜索方法,通过分析时序社交网络用户交互的特点,提出了带有时间约束的社区结构并进一步提出了相应的社区搜索方法以返回具有时效性的社区,所述基于时间跨度优化的短时社区搜索方法包括:
[0008]S1获取用户的查询需求;所述查询需求包括:用来约束社区的子图拓扑结构特征,预设返回短时社区的数量和网络中需要的查询节点;
[0009]S2根据查询需求计算网络中的全局时间跨度上限,获取最大子图;
[0010]S3在所获取的最大子图的范围内找到查询节点所在的集合,获取查询节点的最小短时社区;
[0011]S4将所获取的最小短时社区向外扩展且不超过最大子图范围,将满足条件的社区纳入短时社区集合;
[0012]S5判断当前短时社区集合中社区的数量是否达到查询需求预设返回短时社区的数量:
[0013]若是,则输出短时社区集合;
[0014]若否,则执行S4继续将短时社区向外扩展,将满足条件的社区纳入短时社区集合。
[0015]在基于本公开上述基于时间跨度优化的短时社区搜索方法的另一个实施例中,所述根据查询需求计算网络中的全局时间跨度上限,获取最大子图包括:
[0016]S21在静态网络中找到查询节点所在的社区;所述静态网络不考虑时序特点;
[0017]S22在静态网络中确定查询节点所在完全图的数量,在全部完全图构成的完全图集合中任取一个完全图,计算所取完全图在时序网络中存在不重复的时间跨度的数量;
[0018]S23判断所计算的不重复的时间跨度的数量与完全图集合中除去所取完全图外其它完全图数量之和是否不小于预设返回短时社区的数量:
[0019]若是,则S24将完全图叠加的子图作为最大子图;
[0020]若否,则S25将各完全图在原时序网络范围向外扩展,直到每个完全图在扩展之后重新满足约束社区的子图拓扑结构的约束条件,形成扩展后的子图,计算各扩展后的子图中存在的不重复时间跨度的数量,累加后判断是否不小于预设返回短时社区的数量:
[0021]若是,则各扩展后子图叠加所形成的子图为最大子图;
[0022]若否,则S25,直到扩展后的子图为查询节点所在的社区,各扩展叠加后子图中存在的不重复时间跨度的数量累加后仍小于预设返回短时社区的数量,则在静态网络中找到的查询节点所在社区作为全局时间跨度上限对应的最大子图。
[0023]在基于本公开上述基于时间跨度优化的短时社区搜索方法的另一个实施例中,所述在所获取的最大子图的范围内找到查询节点所在的集合,获取查询节点的最小短时社区包括:
[0024]在最大子图范围查询节点所在的基本块的集合;
[0025]在所有基本块中找到查询节点的最小短时社区;
[0026]计算各基本块的时间跨度,拥有最小时间跨度的基本块为最小短时社区。
[0027]在基于本公开上述基于时间跨度优化的短时社区搜索方法的另一个实施例中,所述向外扩展的方式为向当前区域增加新的节点和边,所增加新的节点和边存在于静态网络
中查询节点所在的社区,不存在于当前的区域中。
[0028]在基于本公开上述基于时间跨度优化的短时社区搜索方法的另一个实施例中,所述将所获取的最小短时社区向外扩展且不超过最大子图的范围,并将满足条件的社区纳入短时社区集合包括:
[0029]根据查询需求计算在每次扩展过程中的渐进时间跨度上限;
[0030]从最小短时社区开始,在新增节点和边对图中时间跨度增量不超过渐进时间跨度上限的基础上,在最大子图的范围内不断新增节点和边,直至再一次满足约束社区的子图拓扑结构的约束条件;
[0031]在新的满足约束社区的子图拓扑结构约束条件的子图上计算子图的最小时间跨度并与扩展前满足约束社区的子图拓扑结构约束条件的子图上计算的最小时间跨度作比较:
[0032]当新的满足约束社区的子图拓扑结构约束条件的子图上计算的子图最小时间跨度等于扩展前满足约束社区的子图拓扑结构约束条件的子图上计算的最小时间跨度时,去除短时社本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种基于时间跨度优化的短时社区搜索方法,其特征在于,包括:S1获取用户的查询需求;所述查询需求包括:用来约束社区的子图拓扑结构特征,预设返回短时社区的数量和网络中需要的查询节点;S2根据查询需求计算网络中的全局时间跨度上限,获取最大子图;S3在所获取的最大子图的范围内找到查询节点所在的集合,获取查询节点的最小短时社区;S4将所获取的最小短时社区向外扩展且不超过最大子图范围,将满足条件的社区纳入短时社区集合;S5判断当前短时社区集合中社区的数量是否达到查询需求预设返回短时社区的数量:若是,则输出短时社区集合;若否,则执行S4继续将短时社区向外扩展,将满足条件的社区纳入短时社区集合。2.根据权利要求1所述的基于时间跨度优化的短时社区搜索方法,其特征在于,所述根据查询需求计算网络中的全局时间跨度上限,获取最大子图包括:S21在静态网络中找到查询节点所在的社区;所述静态网络不考虑时序特点;S22在静态网络中确定查询节点所在完全图的数量,在全部完全图构成的完全图集合中任取一个完全图,计算所取完全图在时序网络中存在不重复的时间跨度的数量;S23判断所计算的不重复的时间跨度的数量与完全图集合中除去所取完全图外其它完全图数量之和是否不小于预设返回短时社区的数量:若是,则S24将完全图叠加的子图作为最大子图;若否,则S25将各完全图在原时序网络范围向外扩展,直到每个完全图在扩展之后重新满足约束社区的子图拓扑结构的约束条件,形成扩展后的子图,计算各扩展后的子图中存在的不重复时间跨度的数量,累加后判断是否不小于预设返回短时社区的数量:若是,则各扩展后子图叠加所形成的子图为最大子图;若否,则S25,直到扩展后的子图为查询节点所在的社区,各扩展叠加后子图中存在的不重复时间跨度的数量累加后仍小于预设返回短时社区的数量,则将在静态网络中找到的查询节点所在社区作为全局时间跨度上限对应的最大子图。3.根据权利要求2所述的基于时间跨度优化的短时社区搜索方法,其特征在于,所述在所获取的最大子图的范围内找到查询节点所在的集合,获取查询节点的最小短时社区包括:在最大子图范围查询节点所在的基本块的集合;在所有基本块中找到查询节点的最小短时社区;计算各基本块的时间跨度,拥有最小时间跨度的基本块为最小短时社区。4.根据权利要求3所述的基于时间跨度优化的短时社区搜索方法,其特征在于:所述向外扩展的方式为向当前区域增加新的节点和边,所增加新的节点和边存在于静态网络中查询节点所在的社区,不存在于当前的区域中。5.根据权利要求4所述的基于时间跨度优化的短时社区搜索方法,其特征在于,所述将所获取的最小短时社区向外扩展且不超过最大子图的范围...

【专利技术属性】
技术研发人员:王朝坤顾天凯楼昀恺竺俊超
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1