一种基于多维数据的社交关系分析方法技术

技术编号:20272595 阅读:18 留言:0更新日期:2019-02-02 03:41
本发明专利技术涉及数据挖掘技术领域,公开了一种基于多维数据的社交关系分析方法,包括如下步骤:室内实时定位轨迹数据的存储步骤:获取并存储用户在室内的定位数据;室内POI停留记录处理步骤:根据设定的用户在某个POI的连续停留条件,从用户在室内的定位数据中得到该用户的POI停留记录;用户初步的同行关系分析步骤:通过比较各用户的POI停留记录,以得知两个用户在某个POI的停留记录有是否有交集;深入的社交关系分析步骤:根据上一步骤所得知的有交集的POI停留记录,以及其他维度的数据判断两个用户间的社交关系。

【技术实现步骤摘要】
一种基于多维数据的社交关系分析方法
本专利技术属于数据挖掘
,具体涉及一种基于多维数据的社交关系分析方法。
技术介绍
现有主流的用户社交关系分析,一部分局限于互联网用户浏览、点击、购物和评论数据,对用户的线上行为作数据分析,无法体现用户活动与其当前所在地理位置的关系;另有部分仅仅以用户移动设备的GPS信号数据作粗略的行为分析,由于人们的活动大部分时间是在室内的,这种仅仅基于GPS信号的数据分析方法不能完整的体现出人们行为特征的全貌。当前,基于定位技术的位置服务(LBS)目前已广泛应用于用户生活的各个方面,室内可采用WIFI、蓝牙、地磁等技术定位;同时,在传统的地理信息的基础上还发展出了兴趣点(POIPointofInterest)这一有别于地理位置点的概念,代表着地图上具有代表性的地物和生活中常见的地理实体,包括餐厅、车站、酒店、标志性建筑物等内容。将与生活息息相关的地理实体抽象为一个点,便于在地图上标示位置信息,方便用户检索、查询等,一般情况下,POI具备两个方面的属性:空间属性和非空间属性,空间属性包括经纬度坐标和文本地址,非空间属性包括名称和分类信息,如商铺、影院、网吧、小区、办公场所和住宅等,不同的地理信息服务商提供的POI数据都会具备这四个基本信息,仅仅侧重点和表达方式各有不同;而室内兴趣点则是将室内空间的具有代表性的部分抽象为一个点,如商场里的某个店铺、电影院,住宅楼里的某一个单元、写字楼里的某个办公室等,由于室内兴趣点具有丰富的信息维度,将其运用到室内定位轨迹数据的分析和挖掘,中能更深入的理解用户的行为习惯,进而解决现有技术的不足,发掘出用户之间的潜在社交关系。
技术实现思路
本专利技术意在提供一种基于多维数据的社交关系分析方法,可以利用室内兴趣点的丰富信息维度,对用户在室内的停留进行分析,进而发掘出用户之间的潜在社交关系。本专利技术中的多维时空数据的社交关系分析方法,包括如下步骤:室内实时定位轨迹数据的存储步骤:获取并存储用户在室内的定位数据;室内POI停留记录处理步骤:根据设定的用户在某个POI的连续停留条件,从用户在室内的定位数据中得到该用户的POI停留记录;用户初步的同行关系分析步骤:通过比较各用户的POI停留记录,以得知两个用户在某个POI的POI停留记录有是否有交集;深入的社交关系分析步骤:根据上一步骤所得知的有交集的POI停留记录,判断两个用户间的社交关系。本专利技术所提出了一种对于静态的室内定位数据作用户停留分析的方法,并基于此方法,通过预先设定连续停留条件,对用户之间在POI的初步同行关系进行挖掘,利用了POI本身所具备的多个信息维度以及定位信息的时间和空间信息维度,深入挖掘出用户之间的社交关系;而连续停留条件可以是但不限于时间条件、空间条件和特定信息条件等任何可以判断用户是否在此处停留的条件。对于室内离线轨迹数据进行处理,结合室内POI的描述信息,可以得到用户在特定室内场景的停留时长、活动范围等,为刻画用户的行为习惯提供了基础。若干个用户在同一时间、同一POI的停留作了交叉分析,初步得到了他们的同行关系。结合其它维度的数据所带来的信息,融合用户初步的同行关系,进而可分析出用户之间特定的社交关系。进一步,在室内POI停留记录处理步骤前还包括,POI停留进行初始化的步骤:将用户在某一时间段内的室内定位数据序列,按时间戳从远及近对该序列作排序;取用户对应某个POI的最开始的一条室内定位数据作为初始的POI停留记录。按照时间戳排序可以很方面的利用定位数据来提供时间维度的信息。进一步,所述连续停留条件为,用户连续两个对应同一POI的定位数据间的时间差小于设定阈值的时间。进一步,所述POI停留记录包括,用户ID、POIID、日期、星期数、起始时间和结束时间;如果为初始的POI停留记录,则起始时间与结束时间相同。进一步,从用户在室内的定位数据中得到该用户的POI停留记录的具体内容为,以初始的POI停留记录为起点,沿时间从远及近的方向逐一判断下一定位数据是否满足连续停留条件,如果是则以当前定位数据的时间更新所述记录的结束时间。进一步,在深入的社交关系分析步骤中,还利用用户的通话记录数据、通讯录数据、交易记录数据及物流记录数据中的一种或多种判断两个用户间的社交关系。这些维度的数据体现了用户间的沟通交流信息,对于判断用户间的社交关系很有帮助。进一步,在深入的社交关系分析步骤中,根据POI具备的特定的属性和同行的时间段分析用户间的社交关系。不同社交关系的用户间的同行POI会有差异,如朋友和家人间会存在不同的POI,再结合同行时间,可以更为准确的推断出用户间的社交关系。附图说明图1为本专利技术实施例中基于多维数据的社交关系分析方法的室内POI停留计算流程图。图2为本专利技术实施例一种基于多维数据的社交关系分析方法的室内定位社交关系计算流程图。具体实施方式下面通过具体实施方式进一步详细说明:本实施例中的基于多维时空数据的社交关系分析方法,分为室内POI停留计算和室内定位社交关系计算两部分,其中室内POI停留计算的流程基本如图1所示,实施方式如下:1.室内实时定位轨迹数据的存储步骤:对于安装了室内定位服务的移动设备,在后台服务器提供实时定位服务的时候,同时将定位数据通过Kafka分布式发布订阅消息系统和SparkStreaming实时计算框架存储到分布式存储系统HDFS上,并按日期创建分区。2.对POI停留记录进行初始化的步骤:1)以一个用户在某一日期(一天)的室内定位数据为例,指定用户ID和某个日期,通过spark加载HDFS上的离线定位数据得到序列,按时间戳从远及近对该序列作排序。2)取用户对应某个POI的最开始的一条记录作为初始的POI停留记录,其时间戳作为起始时间,同时也将该时间戳作为初始的结束时间(在下面一个步骤中不断更新),并通过转换日期添加星期数字段。记录的形式包含如下字段:用户ID,POIID,日期,星期数,起始时间,结束时间。3)进入到序列的下一定位数据记录,进行步骤3的操作。在此步骤中,将用户的记录与具体的POI进行对应的方法,则采用现有技术,可以是但不限于,利用用户当时所接入的AP与POI的对应关系,该关系是可以事先定义的;还可以是根据该记录的定位是否处于某POI所在定位点周围一定范围内来进行记录与具体POI的对应,以上均为现有技术,在此不做过多赘述。3.室内POI停留记录处理步骤:1)设定用户在某个POI连续停留条件,即当前记录与上一条记录的时间差小于某个阈值的时间,则认为当前记录是上一条记录的连续,即在此时刻用户仍然停留在当前POI。2)在步骤2的基础上,当前定位记录与上一条记录的POI和时间,首先记录起始点的POI和时间,如果当前记录同时满足上述的连续停留条件,则保持步骤2中的起始时间不变,更新该记录的时间为停留该POI的结束时间。3)依2)对序列数据逐条顺序判断,直到不满足连续停留条件或POI变化为止,最后更新的结束时间为该用户在该POI上的最终停留时间,保存用户标识、POI标识、停留起始时间和停留结束时间为一条完整的POI停留记录,同时将不满足连续停留条件或POI变化的定位记录按步骤2处理作为一条新的初始的POI停留记录。4)举例详细说明以上步骤,有如下定位轨迹数据(为方本文档来自技高网
...

【技术保护点】
1.一种基于多维数据的社交关系分析方法,其特征在于:包括如下步骤:室内实时定位轨迹数据的存储步骤:获取并存储用户在室内的定位数据;室内POI停留记录处理步骤:根据设定的用户在某个POI的连续停留条件,从用户在室内的定位数据中得到该用户的POI停留记录;用户初步的同行关系分析步骤:通过比较各用户的POI停留记录,以得知两个用户在某个POI的POI停留记录有是否有交集;深入的社交关系分析步骤:根据上一步骤所得知的有交集的POI停留记录,判断两个用户间的社交关系。

【技术特征摘要】
1.一种基于多维数据的社交关系分析方法,其特征在于:包括如下步骤:室内实时定位轨迹数据的存储步骤:获取并存储用户在室内的定位数据;室内POI停留记录处理步骤:根据设定的用户在某个POI的连续停留条件,从用户在室内的定位数据中得到该用户的POI停留记录;用户初步的同行关系分析步骤:通过比较各用户的POI停留记录,以得知两个用户在某个POI的POI停留记录有是否有交集;深入的社交关系分析步骤:根据上一步骤所得知的有交集的POI停留记录,判断两个用户间的社交关系。2.根据权利要求1所述的一种基于多维数据的社交关系分析方法,其特征在于:在室内POI停留记录处理步骤前还包括,对POI停留记录进行初始化的步骤:将用户在某一时间段内的室内定位数据序列,按时间戳从远及近对该序列作排序;取用户对应某个POI的最开始的一条室内定位数据作为初始的POI停留记录。3.根据权利要求2所述的一种基于多维数据的社交关系分析方法,其特征在于:所述连续停留条件为,用户连续两个对应同一POI的定位数据间...

【专利技术属性】
技术研发人员:马元丁双安
申请(专利权)人:元力云网络有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1