一种利用手机信令数据识别家庭关系的方法技术

技术编号:33489532 阅读:36 留言:0更新日期:2022-05-19 01:01
一种利用手机信令数据识别家庭关系的方法属于交通运输领域。家庭数据往往通过人工手段获取,存在调查周期长、调查范围小和耗费巨大等缺点。本发明专利技术根据手机信令数据识别出用户的居住地,并计算用户间的居住地距离,当两用户居住地间距离满足阈值条件时,对用户间的通话特征进行提取,包括夜间居住地相同的天数、通话天数、夜间通话频率和晚高峰通话频率等;根据夜间居住地相同的天数和通话天数两个指标,利用决策树初步将用户间关系分为两个类别:非家庭关系和可能存在家庭关系两大类;基于可能存在家庭关系的群体和少量已知关系的用户间的通话特征,利用KNN方法进一步判断该群体中用户间的关系。本发明专利技术可准确推测手机用户间的家庭关系。户间的家庭关系。户间的家庭关系。

【技术实现步骤摘要】
一种利用手机信令数据识别家庭关系的方法


[0001]本专利技术属于交通运输
利用手机信令数据准确推算手机用户之间的家庭关系,可进一步用于通勤空间特征、出行规律分析等。

技术介绍

[0002]家庭是分析交通出行规律或通勤空间特征的重要单元结构,该数据往往通过人口普查或交通出行调查等人工手段获取,如居民出行调查。人工调查内容虽较为全面,但存在调查周期长、调查范围小和耗费巨大资源等缺点,尤其疫情期间,该方式存在重大安全风险。
[0003]手机信令数据是用户对外通信时,手机与附近的基站进行连接产生的数据,它具有时间上连续、空间上完整、覆盖范围广、细粒度高等优势,弥补了人工调查中周期长、调查范围小等缺陷,采用手机信令数据进行解析,获取信令数据中用户间家庭关系,为职住空间特征分析、城市规划方案的制定提供依据。手机信令数据包含用户唯一标识码、时间戳、基站编号、经度、纬度和通话对象等信息,如表1所示。
[0004]表1:手机信令数据信息
[0005]
技术实现思路

[0006]本专利技术提出一种利用手机信令数据准确识别家庭本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种利用手机信令数据识别家庭关系的方法,其特征在于包括以下步骤:步骤1:数据预处理:定义夜间时段为当日20:00:00—23:59:59和次日00:00:00—7:00:00,对用户U
i
的信令数据按事件发生时间先后排序,提取T
i,j
在夜间范围内的数据记录,根据定义的夜间序列,根据用户信令数据的时间将数据与相应的夜间时段对应,构建夜间数据集合B={B
i,1
,B
i,2
...B
i,m
},B
i,m
表示在第m个夜间时段用户U
i
的手机信令数据构成的集合;步骤2:居住地位置识别:计算用户U
i
的夜间居住地,以B为对象,第m个夜间内,用户连接基站所属交通小区AREA
i,j
的停留时长,一定周期内,通过对相同基站所属交通小区的夜间停留时间进行累加,选取停留时长最大的基站所属交通小区,作为用户U
i
的居住地,记为的居住地,记为和分别代表居住地的经度和纬度,即夜间停留时长最大的基站所属交通小区的质心坐标;步骤3:居住地距离比较:分别对其余所有用户Q={Q1,Q2,...,Q
n
},i≠n,n为自然数,且n>0,进行居住地判断,即循环步骤1和步骤2中操作,并分别计算集合Q与用户U
i
的居住地间直线距离其中为用户Q
n
的居住地位置信息,即用户Q
n
夜间停留时长最大的基站所属交通小区的质心坐标,取出D中元素小于1KM的用户,形成该用户的数据集Z,同时构建用户对集合其中,v为自然数,且v>0,n为自然数,且n>0,指用户Q
v
与用户U
i
的唯一标识码连接起来的用户对;D中元素大于或等于1KM的用户则认为无家庭关系;步骤4:通话特征指标提取,计算集合QU
i
中每一个元素的特征指标,即每一个用户对的特征指标,包括以下四个指标:1)夜间居住地相同的天数:夜间范围内,相较于非家庭成员,具有家庭关系的用户往往具有共同居住地点,因此提出“夜间居住地相同的天数”,记为即在T周期内,用户对的夜间居住地相同的天数;2)通话的天数:相较于非家庭关系的用户,家庭成员间的通话行为更为稳定,提出指标“通话的天数”,记为即用户对在T周期内存在通话行为的天数;3)夜间通话频率:由于家庭成员间的共同居...

【专利技术属性】
技术研发人员:赖见辉罗甜甜黄利华陈艳艳王春松齐悦
申请(专利权)人:首都经济贸易大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1