一种基于时空聚合中间态的信令数据分析方法及装置制造方法及图纸

技术编号:37131343 阅读:18 留言:0更新日期:2023-04-06 21:29
本发明专利技术公开了一种基于时空聚合中间态的信令数据分析方法及装置,首先基于信令数据的特征对数据进行预处理,通过经纬度计算出所属蜂窝区块编号,然后把手机号对应的所有区块编号按照时间顺序保存,同时对保存的时间进行切片划分,得出手机号在过去某段时间内去过的地理轨迹。对于区块编号可以进行手机号的聚合处理,可通过区块编号和时间组合方式进行数据存储,从而可以得出该区块历史上经过的手机号。本发明专利技术可以分析出城市人口的流动情况和人口分布情况。通过本发明专利技术的方法可以在极短时间内找出人员运行轨迹情况,有助于缩短分析时间,在犯罪侦查、医疗防疫领域有较大帮助。医疗防疫领域有较大帮助。医疗防疫领域有较大帮助。

【技术实现步骤摘要】
一种基于时空聚合中间态的信令数据分析方法及装置


[0001]本专利技术属于信令数据分析领域,尤其涉及一种基于时空聚合中间态的信令数据分析方法及装置。

技术介绍

[0002]手机信令数据是一种新型的大数据源,与其他类型的数据相比,其具有实时性、完整性、出行时空全覆盖等其他数据源所不拥有的优势。它是由手机用户在发生通话、发短信或移动位置等事件时,被运营商的通信基站捕获并记录的数据。由此可见,信令数据只要用户开启手机,即可捕获出行信息,这些数据经过加工后可用于居民行为偏好、移动轨迹分析、城镇空间布局等研究。但是由于信令数据存在海量化的特点,运算量大,运行时间较长,尤其是在大范围、长时间的海量数据库中进行运算时,对服务器和软件的配置,以及对算法设计都有较高的要求,因此会带来工作人力、时间等各项成本的提高。同时这样的计算带来的时效性将会偏低,对于有着高时效需求的场景将无法满足。

技术实现思路

[0003]本专利技术的目的在于针对现有技术的不足,提出一种基于时空聚合中间态的信令数据分析方法及装置,以便充分发挥信令数据的特点,提高结果获取的时效性,缩短数据的分析时间。
[0004]本专利技术是通过以下方式来实现的:第一方面,本专利技术提供了一种基于时空聚合中间态的信令数据分析方法,该方法包括以下步骤:
[0005]步骤1、基于用户手机号获取信令数据并进行预处理,把用户手机号所在位置基站的经纬度数据转换成相应的蜂窝区块编号,同时剔除不符合手机号的脏数据;
[0006]步骤2、定义以手机号为顶点,区块编号为值的聚合中间态计算逻辑,同时把区块编号按间隔N分钟进行分片聚合处理,处理后的信令数据会根据该逻辑进行中间态结果的计算;
[0007]步骤3、定义以区块编号和时间组合为顶点,手机号为值的聚合中间态计算逻辑,处理后的信令数据会根据该逻辑进行中间态结果的计算;
[0008]步骤4、经由步骤2和步骤3构建的聚合中间态计算逻辑产生出以手机号、区块编号加时间的两种顶点的聚合中间态数据,用于分析城市人员的分布和活动轨迹。
[0009]进一步地,步骤(1)中,所述的信令数据为用户手机在发生通话、发短信或移动位置事件时,被运营商的通信基站捕获的通讯数据,其包括的要素有手机号、基站经纬度和上报时间。
[0010]进一步地,步骤(1)中,所述的蜂窝区块编号为在卫星地图上使用多边形网格划分出来的地理范围,每一块都有唯一的编号,每一个基站坐标点将归属于一个区块。
[0011]进一步地,步骤(2)中,以手机号为顶点的聚合中间态计算逻辑为用键值对方式存储的数据结构,其中手机号为主键,上报时间和区块编号为值列表,并且区块编号通过上报
时间按分钟精度切片聚合存储。
[0012]进一步地,步骤(3)中,以区块编号和时间组合为顶点的聚合中间态计算逻辑为用键值对方式存储的数据结构,其中区块编号和精度为分钟的上报时间组合在一起形成存储数据的主键,手机号为值列表。
[0013]进一步地,步骤(4)中,所述的信令数据通过文件、消息中间件、接口方式进行获取,基于步骤(2)和(3)定义的计算逻辑得出中间态结果,对于中间态结果系统可提供服务接口供外部系统使用,通过中间态数据分析人员活动行为。
[0014]第二方面,本专利技术还提供了一种基于时空聚合中间态的信令数据分析装置,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,用于实现所述的基于时空聚合中间态的信令数据分析方法的步骤。
[0015]第三方面,本专利技术还提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时,实现所述的基于时空聚合中间态的信令数据分析方法的步骤。
[0016]本专利技术的有益效果:本专利技术提供的是一种针对海量信令数据处理分析的方法及装置,通过聚合中间态的结果缩短分析时间、提升分析能力,本专利技术对信令数据按照手机号和区块编号进行预先聚合计算,产生的中间态结果保存在分布式缓存中,支持外部系统即席查询,通过手机号、区块编号和时间窗口参数即可快速得到分析结果。而使用传统大数据平台进行批式查询往往需要花费小时级别的时间才能得到分析结果,相比之下该方法在性能上有着卓越的优势。
附图说明
[0017]图1是一个实施例的信令数据序列示意图;
[0018]图2是本专利技术方法聚合计算后的结果示意图;
[0019]图3是人员轨迹结果示意图;
[0020]图4是本专利技术方法与传统方法的实施效果对比图;
[0021]图5是本专利技术一种基于时空聚合中间态的信令数据分析装置的结构图。
具体实施方式
[0022]下面结合附图和实施例对本专利技术作进一步详细说明,以下实施例用于说明本专利技术,但不用来限制本专利技术的范围。
[0023]本专利技术提供一种基于时空聚合中间态的信令数据分析方法,是通过把地理位置按多边形划分处理后,把手机号数据和区块编号数据分别按时间存储在手机号和区块编号为顶点的结构中的一种技术方法。传统的大数据平台分析方法,结果获取耗时随查询个数的增加呈快速线性上升趋势,当查询个数较多时性能下降明显。本专利技术方法基于中间态处理数据,其结果获取耗时随查询个数的增加变化不大,在查询个数较多时依然具备较好的性能。同时,该方法可以用于分析城市人员的分布和活动轨迹,用该方法可大幅度缩短数据的处理和分析时间。
[0024]本专利技术提出的一个具体实施例如下:
[0025]1)对于原始的信令数据进行预处理,以通过文件或消息中间件等方式进行存储,所述的信令数据为用户手机在发生通话、发短信或移动位置事件时,被运营商的通信基站
捕获的通讯数据,信令数据中必须包括手机号、基站经度数据、纬度数据、上报时间四个字段的数据内容,所述预处理包括对信令数据文本内容的格式转换、经纬度转换区块编号、剔除不符合手机号格式的脏数据、异常值处理、时间格式处理。信令数据排列方式如图1所示,把经纬度数据转换成相应的蜂窝区块的编号。所述信令数据中的经纬度数据转换为蜂窝区块编号为把真实地区按六边形网格进行划分,每个区块都有唯一编号,每一个基站坐标点将归属于一个区块。信令数据结构见表1。
[0026]表1
[0027]序号手机号经度纬度时间区块ID113666624875120.09128430.3279572022

01

05 08:25:00G1213666624875120.09043230.3287832022

01

05 08:32:00G2313666624875120.08959030.3296092022

01

05 08:45:00G3413666624875120.08872830.3304352022

01

05 09:05:00G4513666624875120.08954530.331261202本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于时空聚合中间态的信令数据分析方法,其特征在于,该方法包括以下步骤:步骤1、基于用户手机号获取信令数据并进行预处理,把用户手机号所在位置基站的经纬度数据转换成相应的蜂窝区块编号,同时剔除不符合手机号的脏数据;步骤2、定义以手机号为顶点,区块编号为值的聚合中间态计算逻辑,同时把区块编号按间隔N分钟进行分片聚合处理,处理后的信令数据会根据该逻辑进行中间态结果的计算;步骤3、定义以区块编号和时间组合为顶点,手机号为值的聚合中间态计算逻辑,处理后的信令数据会根据该逻辑进行中间态结果的计算;步骤4、经由步骤2和步骤3构建的聚合中间态计算逻辑产生出以手机号、区块编号加时间的两种顶点的聚合中间态数据,用于分析城市人员的分布和活动轨迹。2.根据权利要求1中所述的一种基于时空聚合中间态的信令数据分析方法,其特征在于,步骤(1)中,所述的信令数据为用户手机在发生通话、发短信或移动位置事件时,被运营商的通信基站捕获的通讯数据,其包括的要素有手机号、基站经纬度和上报时间。3.根据权利要求1中所述的一种基于时空聚合中间态的信令数据分析方法,其特征在于,步骤(1)中,所述的蜂窝区块编号为在卫星地图上使用多边形网格划分出来的地理范围,每一块都有唯一的编号,每一个基站坐标点将归属于一个区块。4.根据权利要求1中所述的一种基于时空聚合中间态的信令数据分析方法,其特征在...

【专利技术属性】
技术研发人员:王新根金路杨志强王新宇鲍迪恩
申请(专利权)人:浙江邦盛科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1