The invention discloses a relationship mining method based on short-range wireless communication data, which includes: collecting short-range wireless communication data and corresponding auxiliary data; preprocessing short-range wireless communication data to obtain a relationship set; calculating the corresponding mapping proportion by using preset mapping method according to the obtained relationship set, and verifying the presupposition with random mapping proportion. Whether the proposed mapping method is effective or not, and then the effective mapping method is screened out. The effective mapping method is used to map the short-distance wireless communication network node to the social network, so as to realize the relationship mining. Through this method, we can find out the implicit social relationship in short-distance wireless network, make the relationship between short-distance wireless network and social network mapping, and verify the rationality of the mapping method.
【技术实现步骤摘要】
基于短距无线通信数据的关系挖掘方法
本专利技术涉及计算机网络
,尤其涉及一种基于短距无线通信数据的关系挖掘及验证方法。
技术介绍
近年来,随着网络的发展,人与人之间的交流方式也逐渐多样化,不再是局限于传统的面对面交流,甚至不再局限于电话交流的方式。社交媒体软件——一种新兴的交流方式已经受到人们的青睐。人们在使用这些社交媒体软件的过程中,软件会产生大量的数据,通过对这些数据集的收集和研究,我们可以更加清楚地了解社交网络的演变过程。由于有线通信网络技术的优先普及,在线社交网络,如Facebook,Twitter和新浪微博等,已经成为人们在全球范围内获取和分享信息的主要场所,我们发现人们在现实生活中的交友习惯、生活方式等会影响人们在网络中的一些行为习惯,例如现实生活中关系亲密的两个人在网络中的关系可能也很亲密,他们在网络中的交互时间、交互次数(评论、转发等行为都是一次交互)都高于其他人。随着Internet技术、计算机技术、通信技术和电子技术的飞速发展,更因为人们对信息随时随地获取和交换的迫切需要,无线通信开始在人们的生活中扮演着越来越重要的角色,显示出巨大的发展潜力。而在这其中,作为无线通信技术的一个重要分支——短距离无线通信技术因其在技术、成本、可靠性及可实用性方面的突出优势,正逐渐引起人们越来越广泛的关注,目前常见的短距无线通信包括蓝牙,WiFi,ZigBee等等。由此而产生的短距离无线网络也逐渐成为研究热点。短距离无线网络指,网络中节点通信距离较短,但可以通过节点移动来建立通信的网络,所以用户的位置信息隐含在无线连接中。如果我们能够找到短距离无线网 ...
【技术保护点】
1.一种基于短距无线通信数据的关系挖掘方法,其特征在于,包括:收集短距离无线通信数据和相应的辅助数据;对短距离无线通信数据进行预处理,从而获得关系集;根据获得的关系集使用预设的映射方法来计算相应的映射比例,并配合随机映射比例来验证所述预设的映射方法是否有效,从而筛选出有效的映射方法;利用筛选出的有效的映射方法进行短距无线通信网络节点到社交网络的映射,从而实现关系挖掘。
【技术特征摘要】
1.一种基于短距无线通信数据的关系挖掘方法,其特征在于,包括:收集短距离无线通信数据和相应的辅助数据;对短距离无线通信数据进行预处理,从而获得关系集;根据获得的关系集使用预设的映射方法来计算相应的映射比例,并配合随机映射比例来验证所述预设的映射方法是否有效,从而筛选出有效的映射方法;利用筛选出的有效的映射方法进行短距无线通信网络节点到社交网络的映射,从而实现关系挖掘。2.根据权利要求1所述的一种基于短距无线通信数据的关系挖掘方法,其特征在于,所述短距离无线通信数据中包括:网络中的各节点、存在连接关系的节点对以及节点对连接起始时间和终止时间;所述辅助数据包括:各节点的兴趣类型及地理位置。3.根据权利要求1或2所述的一种基于短距无线通信数据的关系挖掘方法,其特征在于,所述对短距离无线通信数据进行预处理包括:首先,合并重复数据并删除不可验证数据;然后,计算个体特征值;再对计算的个体特征值进行归一化降序处理,从而获得关系集;所述合并重复数据并删除不可验证数据包括:将重复节点对的相关数据合并,并删除不可验证数据;所述不可验证数据是指某一节点仅在短距无线通信网络中出现,并未在社交网络中出现。4.根据权利要求3所述的一种基于短距无线通信数据的关系挖掘方法,其特征在于,所计算的个体特征值包括:直接指标、间接指标与辅助指标;其中:直接指标包括:根据短距离无线通信数据统计出的节点对的连接总次数、连接总时间与平均连接时间;间接指标包括:两个节点的共有邻居率与共有地理位置率;其中,所述两个节点在社交网络中存在关系,短距无线通信网络中没有连接关系,两个节点各自计算它们在短距无线通信网络中共同存在连接关系的节点数量占具有连接关系的节点总数的比例,其较大值作为两个节点的共有邻居率;两个节点共有地理位置率,也即两个节点共有地理位置占每个节点总地理位置的比例,其较大值作为两个节点的共有地理位置率;辅助指标包括:每个节点对的共有兴趣率;也即节点对中两个节点共有兴趣占每个节点总兴趣的比例,其较大值作为相应节点对的共有兴趣率。5.根据权利要求4所述的一种基于短距无线通信数据的关系挖掘方法,其特征在于,该方法还包括:定义四种映射类型:直接映射、间接映射、基于单指标映射与基于多指标映射;定义四种映射策略:基于阈值筛选的映射、基于特征值累加的映射、基于信道对称的映射与基于辅助数据映射;四种映射类型与四种映射策略之间两两组合构成成十六种映射方法。6.根据权利要求5所述的一种基于短距无线通信数据的关系挖掘方法,其特征在于,所述直接映射是指,一部分节点对既在无线短距离网络中存在,也在社交网络中存在,根据不同直接指标将这部分节点对映射回社交网络中;所述间接映射是指,一部分节点对在无线短距离网络中不存在,但在社交网络中存在,则根据这两个节点的间接指标映射回社交网络中;所述基于单指标映射是指,从无线短距离网络提取的各种指标中选取一种指标为基准计算出每个节点对的相应指标,并设定阈值,将指标大于阈值所对应的节点对筛选出来,并映射到社交网络中;所述基于多指标映射是指,从无线短距离网络提取的各种指标中选取至少两种指标T1与T2,并设定相应的阈值M1与M2;将在指标T1下大于阈值M1的节点对筛选出来,记为集合TM1,同时将在指标T2下大于阈值M2的节点对筛选出来,记为集合TM2;之后,从集合TM1与TM2中筛选出相同的节点对,将其映射到社交网络中。7.根据权利要求6所述的一种基于短距无线通信数据的关系挖掘方法,其特征在于,基于阈值筛选的映射:针对短距无线通信网络中存在连接关系的节点对使用相同的标准来推断这些节点对是否存在于社交网络中;基于特征值累加的映射:将归一化降序的特征值逐步累加,直到累加值超过阈值,则认为这部分累加值对应的关系存在于社交网络中;基于信道对称的映射:对于关系集Y,将其节点间的关系分为两个级别,比例大于等于r的关系属于大比例层,小于r的关系属于小比例层;将大比例层的数据进行翻转,即源节点和目的节点互换得到新的关系集,删除新关系集中不可验证数据得到关系集Ysub’,再将这个关系集Ysub’与关系集Y合并,从而确定最终的关系集L=Y∪Ysub’并在映射时使用确定的最终的关系集L;基于辅助数据映射:利用节点对的共有兴趣率来进行映射,若短距无线通信网络中某些节点对没有共有兴趣率,则节点对的共有兴趣率默认为0。8.根据权利要求7所述的一种基于短距无线通信数据的关系挖掘方法,其特征在于,所述根据获得的关系集使用预设的映射方法来计算相应的映射比例,并配合随机映射比例来验证所述预设的映射方法是否有效包括:假设设短距无线通信网络中关系集为Y={y1,y2,y3,…,yn};其中的yi表示一个节点对,i=1,2,3,...,n;使用预设的映射方法来计算相应的映射比例包括:利用预设的映射方法确定需要映射的节点对数量Q,再计算Q个节点对在社交网络中也存在连接关系的节点对数量q与...
【专利技术属性】
技术研发人员:蔺智挺,项雅琴,李文娜,孙李兵,吴秀龙,彭春雨,黎轩,陈军宁,
申请(专利权)人:安徽大学,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。