一种基于基站数据的用户轨迹聚合方法技术

技术编号:37233203 阅读:17 留言:0更新日期:2023-04-20 23:15
本发明专利技术公开了一种基于基站数据的用户轨迹聚合方法。它包括信令采集模块、用户位置点生成模块、用户轨迹形成模块、用户基于路径顺序相似度度量模块、用户轨迹聚类模块,信令采集模块实现基站信令数据的采集,用户位置点生成模块将信令数据结合基站位置转化为用户的时刻位置点,用户轨迹形成模块将用户的位置点形成轨迹点,用户基于路径顺序相似度度量模块根据路径相似度获取相似度矩阵,用户轨迹聚类模块对相似度矩阵进行聚类获得用户的出行轨迹。本发明专利技术的有益效果是:结合基站的用户信令数据,得到用户的位置信息;以天为单位,对用户的轨迹进行聚合,形成人群出行规律,从而更好地支持人群的分类和数据价值的挖掘,挖掘用户的周期活动模式。的周期活动模式。的周期活动模式。

【技术实现步骤摘要】
一种基于基站数据的用户轨迹聚合方法


[0001]本专利技术涉及运营商基站数据挖掘相关
,尤其是指一种基于基站数据的用户轨迹聚合方法。

技术介绍

[0002]随着4G、5G等技术的普及,运营商的基站的分布密度大大增强,特别是市区,其基站的覆盖度可以达到方圆500米一个基站,通过手机和附近多个基站之间的心跳连接,运营商可以提供基于基站收集到的信令数据。运营商的用户数量比较庞大,这些信令数据包含了人们各类重要的信息,如用户的出行习惯、消费特征、行为特征等,通过收集这些海量信令数据进行分析挖掘,进一步挖掘用户的多元性价值,从而提供根据针对性的服务,同时这些数据也可开放给政府等,进行特定人员的位置摸排,流动人口的排查等。现有技术中并不存在对基站信令数据的具体分析挖掘,并做进一步的价值分析。

技术实现思路

[0003]本专利技术是为了克服现有技术中存在上述的不足,提供了一种能够挖掘用户周期活动模式的基于基站数据的用户轨迹聚合方法。
[0004]为了实现上述目的,本专利技术采用以下技术方案:
[0005]一种基于基站数据的用户轨迹聚合方法,包括信令采集模块、用户位置点生成模块、用户轨迹形成模块、用户基于路径顺序相似度度量模块、用户轨迹聚类模块,所述信令采集模块实现基站信令数据的采集,所述用户位置点生成模块将信令数据结合基站位置转化为用户的时刻位置点,所述用户轨迹形成模块将用户的位置点形成轨迹点,所述用户基于路径顺序相似度度量模块根据路径相似度获取相似度矩阵,所述用户轨迹聚类模块对相似度矩阵进行聚类获得用户的出行轨迹;具体操作步骤如下:
[0006](1)信令采集模块将运营商各个基站的信令数据进行采集,每5分钟,信令数据通过信令采集模块汇聚至省中心数据处理中心;
[0007](2)用户位置点生成模块将信令数据转化为用户的实时经纬度点,通过将用户某一时刻的信令数据以及关联的基站位置结合,使用基站定位法计算用户的经纬度位置点;
[0008](3)用户轨迹形成模块按天形成每个用户的路径特征空间;
[0009](4)用户基于路径顺序相似度度量模块以周为单位,对用户的每天的轨迹两两之间形成路径的相似度,并最终形成某一用户的一周相似度矩阵;
[0010](5)用户轨迹聚类模块使用基于矩阵变换的层次聚类算法,对相似度矩阵进行聚类,选择路径数量最多的类簇作为用户常用出行轨迹,低于阈值的则为用户的异常出行轨迹。
[0011]本专利技术利用了信令数据,形成用户的位置点,根据时间顺序形成用户轨迹,对于每个用户的基于路径顺序的相似度度量,最后根据相似度度量结果,基于矩阵变换的层次聚类法对每个用户的轨迹进行聚合,从而形成每个用户的出行规律。结合基站的用户信令数
据,得到用户的位置信息;以天为单位,对用户的轨迹进行聚合,形成基于运行商的人群出行规律,从而更好地支持人群的分类和数据价值的挖掘。本专利技术实现了基于用户位置数据(oidd),分析和计算每天用户出行轨迹,并在一定的时间周期内,将用户每日出行轨迹进行聚合,从而挖掘用户的周期活动模式。
[0012]作为优选,在步骤(2)中,基站定位法依据关联基站经纬度、信令场强计算出此时用户的经纬度点,其具体步骤如下:
[0013](21)将基站信令数据按手机号进行分桶,将同一用户的信令数据划分至同一空间;
[0014](22)对于每个用户的所有信令数据,选择此用户的某一时刻的所有信令数据,组成信令集合:T={X
t1
,X
t2
,X
t3
,X
t4


,X
tn
},其中T表示某一时刻某用户的所有信令数据的集合,X
ti
表示t时刻用户在i基站连接的电平值;
[0015](23)选择信令集合中某一站点的信令,根据传播模型算法,结合基站发射功率、挂高、天线和信令中的场强值,计算出此信令点距离基站的距离,同样的,用此方法计算出所有用户距离信令所在基站的距离;
[0016](24)将此用户距离每个基站的距离为半径形成圆,计算得到这些圆相交的交点,利用这些交点构成一个凸多边形,计算此多边形的质心,此质心的位置则为此时刻用户的经纬度位置;
[0017](25)形成基于运营商基站的用户位置数据。
[0018]作为优选,在步骤(3)中,用户轨迹形成模块对用户位置数据进行处理,形成每个用户的路径特征空间,每个用户按天为最小单元进行合并,并以一周为集合形成轨迹聚合的路径特征空间,其具体处理流程如下:
[0019](31)以天为单位,按时间顺序对用户的位置点经信排序:
[0020]Q=q1,q2,...,q
n
[0021]其中,Q为用户的n跳路径,是一个包含n个节点的路径,表示用户某一天的路径,q1,q2,

,qn分别表示这一天用户所经过的经纬度点,并且按时间顺序升序进行排列;
[0022](32)选取此用户一周的数据,构成用户轨迹聚合所需的路径特征空间:
[0023][0024]其中,f(Q)为聚合路径Q的特征空间,其中r最大值为7,Q
l
为某天的所有可能的路径的集合,即:
[0025]Q
l
={q
l1
,q
l2
,...,q
ln
,|l=1,2,...,r]。
[0026]作为优选,在步骤(4)中,具体为,用户基于路径顺序相似度度量模块通过计算获取用户一周任意两天路径之间相似度:
[0027][0028]其中,Q
i
表示用户第i天的路径,Q
j
表示用户第j天路径,sim(Q
i
,Q
j
)表示任意两条路径之间的相似度,用两条路径之间的自然角度来度量;<Q
i
,Q
i
>
l
是Q
i
和Q
i
在特征空间中的
内积,<Q
j
,Q
j
>
l
是Q
j
和Q
j
在特征空间中的内积,<Q
i
,Q
j
>
l
是Q
i
和Q
j
在特征空间中的内积,其具体计算方式如下:
[0029][0030]其中,q表示需要比较相似度路径之间每天同一时刻的经纬度点,q
T
为转置矩阵。
[0031]作为优选,一周用户轨迹特征空间经过两两相似度比较,相似度矩阵为一个7X7的矩阵:
[0032][0033]其中,simij表示第i天和第j天的路径的相似度。
[0034]作为优选,在步骤(5)中,具体为:用户轨迹聚本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于基站数据的用户轨迹聚合方法,其特征是,包括信令采集模块、用户位置点生成模块、用户轨迹形成模块、用户基于路径顺序相似度度量模块、用户轨迹聚类模块,所述信令采集模块实现基站信令数据的采集,所述用户位置点生成模块将信令数据结合基站位置转化为用户的时刻位置点,所述用户轨迹形成模块将用户的位置点形成轨迹点,所述用户基于路径顺序相似度度量模块根据路径相似度获取相似度矩阵,所述用户轨迹聚类模块对相似度矩阵进行聚类获得用户的出行轨迹;具体操作步骤如下:(1)信令采集模块将运营商各个基站的信令数据进行采集,每5分钟,信令数据通过信令采集模块汇聚至省中心数据处理中心;(2)用户位置点生成模块将信令数据转化为用户的实时经纬度点,通过将用户某一时刻的信令数据以及关联的基站位置结合,使用基站定位法计算用户的经纬度位置点;(3)用户轨迹形成模块按天形成每个用户的路径特征空间;(4)用户基于路径顺序相似度度量模块以周为单位,对用户的每天的轨迹两两之间形成路径的相似度,并最终形成某一用户的一周相似度矩阵;(5)用户轨迹聚类模块使用基于矩阵变换的层次聚类算法,对相似度矩阵进行聚类,选择路径数量最多的类簇作为用户常用出行轨迹,低于阈值的则为用户的异常出行轨迹。2.根据权利要求1所述的一种基于基站数据的用户轨迹聚合方法,其特征是,在步骤(2)中,基站定位法依据关联基站经纬度、信令场强计算出此时用户的经纬度点,其具体步骤如下:(21)将基站信令数据按手机号进行分桶,将同一用户的信令数据划分至同一空间;(22)对于每个用户的所有信令数据,选择此用户的某一时刻的所有信令数据,组成信令集合:T={X
t1
,X
t2
,X
t3
,X
t4


,X
tn
},其中T表示某一时刻某用户的所有信令数据的集合,X
ti
表示t时刻用户在i基站连接的电平值;(23)选择信令集合中某一站点的信令,根据传播模型算法,结合基站发射功率、挂高、天线和信令中的场强值,计算出此信令点距离基站的距离,同样的,用此方法计算出所有用户距离信令所在基站的距离;(24)将此用户距离每个基站的距离为半径形成圆,计算得到这些圆相交的交点,利用这些交点构成一个凸多边形,计算此多边形的质心,此质心的位置则为此时刻用户的经纬度位置;(25)形成基于运营商基站的用户位置数据。3.根据权利要求2所述的一种基于基站数据的用户轨迹聚合方法,其特征是,在步骤(3)中,用户轨迹形成模块对用户位置数据进行处理,形成每个用户的路径特征空间,每个用户按天为最小单元进行合并,并以一周为集合形成轨迹聚合的路径特征空间,其具体处理流程如下:(31)以天为单位,按时间顺序对用户的位置点经信排序:Q=q1,q2,...,q
n
其中,Q为用户的n跳路径,是一个包含n个节点的路径,表示用户某一天的路径,q1,q2,

,qn分别表示这一天用户所经过的经纬度点,并且按时间顺序升序进行排列;(32)选取此用户一周的数据,构成用户轨迹聚合所需的路径特征空间:
其中,f(Q)为聚合路径Q的特征空间,其中r最大值为7,Q
l
为某天的所有可能的路径的集合,即:Q
l
={q
l1
,q
l2
,...,q
ln
,|l=1,2,...,r}。4.根据权利要求1或2或3所述的一种基于基站数据的用户轨迹聚合方法,其特征是,在步骤(4)中,具体为,用户基于路径顺序相似度度量模块通过计算获取用户一周任意两天路径之间相似度:其中,Q
i
表示用户第i天的路径,Q
j
表示用户第j天路径,sim(Q
i
,Q
...

【专利技术属性】
技术研发人员:马高峰黄蕾马颖蕾虞佳成吴敬波
申请(专利权)人:浙江原初数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1