当前位置: 首页 > 专利查询>安徽大学专利>正文

基于短距无线通信数据的关系挖掘方法技术

技术编号:20370526 阅读:66 留言:0更新日期:2019-02-16 20:42
本发明专利技术公开了一种基于短距无线通信数据的关系挖掘方法,包括:收集短距离无线通信数据和相应的辅助数据;对短距离无线通信数据进行预处理,从而获得关系集;根据获得的关系集使用预设的映射方法来计算相应的映射比例,并配合随机映射比例来验证所述预设的映射方法是否有效,从而筛选出有效的映射方法;利用筛选出的有效的映射方法进行短距无线通信网络节点到社交网络的映射,从而实现关系挖掘。通过该方法可以找出短距离无线网络中隐含的社会关系,使得短距离无线网络与社交网络关系进行映射,并验证映射方法的合理性。

Relation Mining Method Based on Short Range Wireless Communication Data

The invention discloses a relationship mining method based on short-range wireless communication data, which includes: collecting short-range wireless communication data and corresponding auxiliary data; preprocessing short-range wireless communication data to obtain a relationship set; calculating the corresponding mapping proportion by using preset mapping method according to the obtained relationship set, and verifying the presupposition with random mapping proportion. Whether the proposed mapping method is effective or not, and then the effective mapping method is screened out. The effective mapping method is used to map the short-distance wireless communication network node to the social network, so as to realize the relationship mining. Through this method, we can find out the implicit social relationship in short-distance wireless network, make the relationship between short-distance wireless network and social network mapping, and verify the rationality of the mapping method.

【技术实现步骤摘要】
基于短距无线通信数据的关系挖掘方法
本专利技术涉及计算机网络
,尤其涉及一种基于短距无线通信数据的关系挖掘及验证方法。
技术介绍
近年来,随着网络的发展,人与人之间的交流方式也逐渐多样化,不再是局限于传统的面对面交流,甚至不再局限于电话交流的方式。社交媒体软件——一种新兴的交流方式已经受到人们的青睐。人们在使用这些社交媒体软件的过程中,软件会产生大量的数据,通过对这些数据集的收集和研究,我们可以更加清楚地了解社交网络的演变过程。由于有线通信网络技术的优先普及,在线社交网络,如Facebook,Twitter和新浪微博等,已经成为人们在全球范围内获取和分享信息的主要场所,我们发现人们在现实生活中的交友习惯、生活方式等会影响人们在网络中的一些行为习惯,例如现实生活中关系亲密的两个人在网络中的关系可能也很亲密,他们在网络中的交互时间、交互次数(评论、转发等行为都是一次交互)都高于其他人。随着Internet技术、计算机技术、通信技术和电子技术的飞速发展,更因为人们对信息随时随地获取和交换的迫切需要,无线通信开始在人们的生活中扮演着越来越重要的角色,显示出巨大的发展潜力。而在这其中,作为无线通信技术的一个重要分支——短距离无线通信技术因其在技术、成本、可靠性及可实用性方面的突出优势,正逐渐引起人们越来越广泛的关注,目前常见的短距无线通信包括蓝牙,WiFi,ZigBee等等。由此而产生的短距离无线网络也逐渐成为研究热点。短距离无线网络指,网络中节点通信距离较短,但可以通过节点移动来建立通信的网络,所以用户的位置信息隐含在无线连接中。如果我们能够找到短距离无线网络中的隐含社会关系,它可以被用来进行更加精准的推荐服务、信息搜索等方面。对社交网络和短距无线网络的综合分析研究已经是大势所趋,但是目前在研究领域中这种跨类型网络的综合分析还很匮乏,很多研究都聚焦在单一种类型的网络中,在单一类型网络探索用户关系、用户关系强度等,而对于短距离无线网络于其他网络之间的用户关系是否存在一定的联系并没有人提出具体合理的研究方法。以如下现有技术为例来进行说明,如图1所示,此技术提出了一种基于新浪微博微博位置注册数据的个人社会关系研究方法。设计了一个挖掘框架,通过使用其轨迹的空间和时间特征来分析用户之间的相似性,这些特征由新浪微博位置注册数据表示,充分考虑并利用具有大量和离散特征的微博位置登记数据,并从空间和时间维度中筛选数据。从微博位置注册数据中提取“用户活动区域”,以便为每个用建立空间矢量,在此基础上,用户之间的社交关系可以通过用户空间矢量的相似性来挖掘。然而,该方法是一种在线网络的关系挖掘方法,由于短距离无线网络本身的高度动态性,短距离特性,其他网络的挖掘方法不能充分挖掘其关系;同时,现在很多用户在注册时填写的位置信息不准确,与实际位置相差很大,从而导致分析结果与实际结果存在一定差异。
技术实现思路
本专利技术的目的是提供一种基于短距无线通信数据的关系挖掘方法,可以准确挖掘出短距离无线网络中的隐含社会关系。本专利技术的目的是通过以下技术方案实现的:一种基于短距无线通信数据的关系挖掘方法,包括:收集短距离无线通信数据和相应的辅助数据;对短距离无线通信数据进行预处理,从而获得关系集;根据获得的关系集使用预设的映射方法来计算相应的映射比例,并配合随机映射比例来验证所述预设的映射方法是否有效,从而筛选出有效的映射方法;利用筛选出的有效的映射方法进行短距无线通信网络节点到社交网络的映射,从而实现关系挖掘。由上述本专利技术提供的技术方案可以看出,通过处理短距离无线网络通信信息,可以找出短距离无线网络中隐含的社会关系,使得短距离无线网络与社交网络关系进行映射,并验证映射方法的合理性。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。图1为本专利技术
技术介绍
提供的现有技术提供的关系挖掘流程图;图2为本专利技术实施例提供的一种基于短距无线通信数据的关系挖掘方法的流程图图3为本专利技术实施例提供的计算共有兴趣率的示意图;图4为本专利技术实施例提供的归一化降序处理结果示意图;图5为本专利技术实施例提供的映射类型与映射策略示意图。具体实施方式下面结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术的保护范围。本专利技术实施例提供一种基于短距无线通信数据的关系挖掘方法,如图2所示,其主要包括:步骤S1、收集短距离无线通信数据和相应的辅助数据。本专利技术实施例中,所述短距离无线通信数据中包括:网络中的各节点、存在连接关系的节点对以及节点对连接起始时间和终止时间;为了提高映射的精确性,还可以收集辅助数据,辅助数据就是其他网络类型的数据,例如从在线社交网络中收集的用户兴趣类型、地理位置等等。如
技术介绍
所记载的,短距离无线通信可以是蓝牙、WiFi、ZigBee等。步骤S2、对短距离无线通信数据进行预处理,从而获得关系集。预处理主要包括如下三个过程:1)合并重复数据并删除不可验证数据。短距离无线通信数据中含有大量冗余信息,将重复节点对的相关数据合并,并删除不可验证数据,形成可验证节点数据集;所述不可验证数据是指某一节点仅在短距无线通信网络中出现,并未在社交网络中出现。2)计算个体特征值。所计算的个体特征值包括:直接指标、间接指标与辅助指标;其中:直接指标包括:根据短距离无线通信数据统计出的节点对的连接总次数、连接总时间与平均连接时间。短距离无线通信数据中包含每次节点对的连接起始时间和终止时间,所以就可以先计算出用户每次连接的时间,然后将重复节点对合并,节点对每出现一次就表明连接了一次,因此可以据此统计出用户的连接总次数、连接总时间,平均连接时间。间接指标包括:两个节点的共有邻居率、共有地理位置率等;所述两个节点在社交网络中存在关系,短距无线通信网络中没有连接关系,两个节点各自计算它们在短距无线通信网络中共同存在连接关系的节点数量占具有连接关系的节点总数的比例,其较大值作为两个节点的共有邻居率。如图3所示,假设两个节点A,B,在短距离无线网络中没有之间的联系(没有直接的无线通信),但是在在线社交网络中存在关系。在短距离无线网络中A与C,D,E,F,G,H,J有过连接,B与C,D,E,F,G,K,L,Z,X有过连接,由此产生间接映射指标共有邻居率,对A而言共有邻居率=5/7≈71.5%;,同理对B而言共有邻居率=5/9≈55.6%,为了方便,本专利技术实施例定义规定对两个节点AB来说共有邻居率均为71.5%(取两者最大值,但须提出,这种处理方法不唯一)。两个节点共有地理位置率,也即两个节点共有地理位置占每个节点总地理位置的比例,其较大值作为两个节点的共有地理位置率。实际上,间接指标种类很多,专利技术实施例仅以上述两种间接指标为例进行了说明,其他的间接指标可以根据实际情况来选择。辅助指标包括:每个节点对的共有兴趣率;也即节点对中两个节本文档来自技高网
...

【技术保护点】
1.一种基于短距无线通信数据的关系挖掘方法,其特征在于,包括:收集短距离无线通信数据和相应的辅助数据;对短距离无线通信数据进行预处理,从而获得关系集;根据获得的关系集使用预设的映射方法来计算相应的映射比例,并配合随机映射比例来验证所述预设的映射方法是否有效,从而筛选出有效的映射方法;利用筛选出的有效的映射方法进行短距无线通信网络节点到社交网络的映射,从而实现关系挖掘。

【技术特征摘要】
1.一种基于短距无线通信数据的关系挖掘方法,其特征在于,包括:收集短距离无线通信数据和相应的辅助数据;对短距离无线通信数据进行预处理,从而获得关系集;根据获得的关系集使用预设的映射方法来计算相应的映射比例,并配合随机映射比例来验证所述预设的映射方法是否有效,从而筛选出有效的映射方法;利用筛选出的有效的映射方法进行短距无线通信网络节点到社交网络的映射,从而实现关系挖掘。2.根据权利要求1所述的一种基于短距无线通信数据的关系挖掘方法,其特征在于,所述短距离无线通信数据中包括:网络中的各节点、存在连接关系的节点对以及节点对连接起始时间和终止时间;所述辅助数据包括:各节点的兴趣类型及地理位置。3.根据权利要求1或2所述的一种基于短距无线通信数据的关系挖掘方法,其特征在于,所述对短距离无线通信数据进行预处理包括:首先,合并重复数据并删除不可验证数据;然后,计算个体特征值;再对计算的个体特征值进行归一化降序处理,从而获得关系集;所述合并重复数据并删除不可验证数据包括:将重复节点对的相关数据合并,并删除不可验证数据;所述不可验证数据是指某一节点仅在短距无线通信网络中出现,并未在社交网络中出现。4.根据权利要求3所述的一种基于短距无线通信数据的关系挖掘方法,其特征在于,所计算的个体特征值包括:直接指标、间接指标与辅助指标;其中:直接指标包括:根据短距离无线通信数据统计出的节点对的连接总次数、连接总时间与平均连接时间;间接指标包括:两个节点的共有邻居率与共有地理位置率;其中,所述两个节点在社交网络中存在关系,短距无线通信网络中没有连接关系,两个节点各自计算它们在短距无线通信网络中共同存在连接关系的节点数量占具有连接关系的节点总数的比例,其较大值作为两个节点的共有邻居率;两个节点共有地理位置率,也即两个节点共有地理位置占每个节点总地理位置的比例,其较大值作为两个节点的共有地理位置率;辅助指标包括:每个节点对的共有兴趣率;也即节点对中两个节点共有兴趣占每个节点总兴趣的比例,其较大值作为相应节点对的共有兴趣率。5.根据权利要求4所述的一种基于短距无线通信数据的关系挖掘方法,其特征在于,该方法还包括:定义四种映射类型:直接映射、间接映射、基于单指标映射与基于多指标映射;定义四种映射策略:基于阈值筛选的映射、基于特征值累加的映射、基于信道对称的映射与基于辅助数据映射;四种映射类型与四种映射策略之间两两组合构成成十六种映射方法。6.根据权利要求5所述的一种基于短距无线通信数据的关系挖掘方法,其特征在于,所述直接映射是指,一部分节点对既在无线短距离网络中存在,也在社交网络中存在,根据不同直接指标将这部分节点对映射回社交网络中;所述间接映射是指,一部分节点对在无线短距离网络中不存在,但在社交网络中存在,则根据这两个节点的间接指标映射回社交网络中;所述基于单指标映射是指,从无线短距离网络提取的各种指标中选取一种指标为基准计算出每个节点对的相应指标,并设定阈值,将指标大于阈值所对应的节点对筛选出来,并映射到社交网络中;所述基于多指标映射是指,从无线短距离网络提取的各种指标中选取至少两种指标T1与T2,并设定相应的阈值M1与M2;将在指标T1下大于阈值M1的节点对筛选出来,记为集合TM1,同时将在指标T2下大于阈值M2的节点对筛选出来,记为集合TM2;之后,从集合TM1与TM2中筛选出相同的节点对,将其映射到社交网络中。7.根据权利要求6所述的一种基于短距无线通信数据的关系挖掘方法,其特征在于,基于阈值筛选的映射:针对短距无线通信网络中存在连接关系的节点对使用相同的标准来推断这些节点对是否存在于社交网络中;基于特征值累加的映射:将归一化降序的特征值逐步累加,直到累加值超过阈值,则认为这部分累加值对应的关系存在于社交网络中;基于信道对称的映射:对于关系集Y,将其节点间的关系分为两个级别,比例大于等于r的关系属于大比例层,小于r的关系属于小比例层;将大比例层的数据进行翻转,即源节点和目的节点互换得到新的关系集,删除新关系集中不可验证数据得到关系集Ysub’,再将这个关系集Ysub’与关系集Y合并,从而确定最终的关系集L=Y∪Ysub’并在映射时使用确定的最终的关系集L;基于辅助数据映射:利用节点对的共有兴趣率来进行映射,若短距无线通信网络中某些节点对没有共有兴趣率,则节点对的共有兴趣率默认为0。8.根据权利要求7所述的一种基于短距无线通信数据的关系挖掘方法,其特征在于,所述根据获得的关系集使用预设的映射方法来计算相应的映射比例,并配合随机映射比例来验证所述预设的映射方法是否有效包括:假设设短距无线通信网络中关系集为Y={y1,y2,y3,…,yn};其中的yi表示一个节点对,i=1,2,3,...,n;使用预设的映射方法来计算相应的映射比例包括:利用预设的映射方法确定需要映射的节点对数量Q,再计算Q个节点对在社交网络中也存在连接关系的节点对数量q与...

【专利技术属性】
技术研发人员:蔺智挺项雅琴李文娜孙李兵吴秀龙彭春雨黎轩陈军宁
申请(专利权)人:安徽大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1