基于空间轨迹大数据分析的人员管控方法及系统技术方案

技术编号:11830724 阅读:102 留言:0更新日期:2015-08-05 15:22
本发明专利技术涉及人员行为模式分析技术领域,具体地说是一种基于空间轨迹大数据分析的人员管控方法及系统,其包括重点人员轨迹数据抽取,对用户指定的重点人员、空间区域以及时间范围,根据身份证号从多个数据库查询该人员的轨迹地址信息;根据轨迹地址名称,从地址库中找到对应的地理经纬度坐标。最终,每个重点人员都可以表示为一个对应的地理坐标序列;轨迹数据向量化;对轨迹模式进行潜语义分析,对矩阵进行奇异值分解,然后降维重建矩阵,重建后的矩阵即为重点人员轨迹模式的潜在语义矩阵;对重点人员进行聚类,根据聚类处理结果分配管控任务,本发明专利技术相对于现有技术能够从海量的人员轨迹数据中,挖掘重点人员潜在联系,并合理分配管控任务。

【技术实现步骤摘要】

: 本专利技术涉及人员行为模式分析
,具体地说是一种能够根据空间活动轨迹 对一批重点监控人员进行聚类的基于空间轨迹大数据分析的人员管控方法及系统
技术介绍
: 随着第二代居民身份证的普及,二代证读卡器的应用也逐渐深入到各行各业,例 如网吧、旅馆、银行、火车站等。因此,基于二代证的人员轨迹信息数据也呈爆发式的增长。 在公安部门,经常需要通过身份证对一些特定的重点人员进行跟踪和管控。重点人员管控 是公安情报工作的重要内容,也是基层民警对人员和辖区管理的重点,但现阶段重点人员 管控只存在于数据层面,大部分分析模型设置的不科学,致使公安情报部门和基层民警管 控工作疲于应付,没有落到实处,没有形成直观的管控思维。 近年来,各地公安部门先后建立了警用地理信息系统平台,为公安部门的业务发 展、工作能力提升提供了新的技术支撑。警用地理信息系统平台是改变公安信息化格局的 重要平台,公安部门情报分析应用与警用地理信息系统平台的结合将成为今后公安工作的 总体思路。 当前,公安行业已经进入了大数据时代。大数据分析是公安业务今后发展的重要 方向,也是公安部门必须面临的挑战。通过对空间轨迹进行大数据分析,公安人员能够快速 的挖掘重点人员之间的潜在联系,进行分类处理,这对公安部门管控重点人员能够起到很 好的辅助作用。 目前学术界关于人员轨迹分析已经有大量的研宄成果,但是这些研宄成果多是过 于理论化,并没有结合实际应用场景做特定的优化,尤其是针对警用犯罪行为分析方面的 优化更少。基层公安部门人力有限,只能在一定辖区地理范围内开展工作,所以基于空间轨 迹的大数据分析算法输出的结果必须要满足现实需求才能真的起到有益作用。
技术实现思路
: 本专利技术针对现有技术存在的缺点和不足,提出一种从海量的人员轨迹数据中,挖 掘重点人员潜在联系,并合理分配管控任务的基于空间轨迹大数据分析的人员管控方法及 系统。 本专利技术通过以下措施达到: 一种基于空间轨迹大数据分析的人员管控方法,其特征在于包括以下步骤: 步骤1 :重点人员轨迹数据抽取,对用户指定的重点人员、空间区域以及时间范 围,根据身份证号从多个数据库查询该人员的轨迹地址信息;根据轨迹地址名称,从地址库 中找到对应的地理经炜度坐标。最终,每个重点人员都可以表示为一个对应的地理坐标序 列; 步骤2 :轨迹数据向量化,对用户指定的空间区域进行网格化处理,对每个网格进 行编号;然后根据第一步提取的坐标信息,对每个重点人员的轨迹序列进行基于网格序号 的直方图统计,重点人员在某个网格范围内出现一次,那么该网格对应的直方图计数加一, 最终,每个重点人员都可以表示为一个向量; 步骤3 :对轨迹模式进行潜语义分析,将一批重点人员的轨迹向量表示为一个矩 阵,其中矩阵的每一列表示一个重点人员的轨迹,每一行表示用户指定的空间区域的一个 网格,矩阵的一个元素表示某个重点人员在该网格范围内出现的次数,对矩阵进行奇异值 分解,然后降维重建矩阵,重建后的矩阵即为重点人员轨迹模式的潜在语义矩阵; 步骤4 :对重点人员进行聚类。根据前一步获得的潜在语义矩阵,使用k-means方 法对重点人员进行聚类处理; 步骤5 :根据聚类处理结果分配管控任务。 本专利技术所述步骤3中的潜语义分析采用如下模型实现:该模型的核心是奇异值分 解,奇异值分解表不为: X = U 2 VT其中X表示输入矩阵,U和V表示两个正交矩阵,2表示对角矩阵。 本专利技术步骤4中运行的聚类算法采用k-means方法,算法过程中使用余弦距离或 欧式距离作为度量标准。 两个向量的余弦距离的定义如下:【主权项】1. 一种基于空间轨迹大数据分析的人员管控方法,其特征在于包括以下步骤: 步骤1:重点人员轨迹数据抽取,对用户指定的重点人员、空间区域以及时间范围,根 据身份证号从多个数据库查询该人员的轨迹地址信息;根据轨迹地址名称,从地址库中找 到对应的地理经炜度坐标,最终每个重点人员都可以表示为一个对应的地理坐标序列; 步骤2 :轨迹数据向量化,对用户指定的空间区域进行网格化处理,对每个网格进行编 号;然后根据第一步提取的坐标信息,对每个重点人员的轨迹序列进行基于网格序号的直 方图统计,重点人员在某个网格范围内出现一次,那么该网格对应的直方图计数加一,最终 每个重点人员都可以表示为一个向量; 步骤3 :对轨迹模式进行潜语义分析,将一批重点人员的轨迹向量表示为一个矩阵,其 中矩阵的每一列表示一个重点人员的轨迹,每一行表示用户指定的空间区域的一个网格, 矩阵的一个元素表示某个重点人员在该网格范围内出现的次数,对矩阵进行奇异值分解, 然后降维重建矩阵,重建后的矩阵即为重点人员轨迹模式的潜在语义矩阵; 步骤4 :对重点人员进行聚类,根据前一步获得的潜在语义矩阵,使用k-means方法对 重点人员进行聚类处理; 步骤5 :根据聚类处理结果分配管控任务。2. 根据权利要求1所述的一种基于空间轨迹大数据分析的人员管控方法,其特征在于 所述步骤3中的潜语义分析采用如下模型实现:该模型的核心是奇异值分解,奇异值分解 表示为:X = U E VT,其中X表示输入矩阵,U和V表示两个正交矩阵,E表示对角矩阵;具 体包括:将每个重点人员的上网轨迹抽象为一个向量,那么一批人员的轨迹向量表示为一位置的关系,每一行ri= 表示一个空间位置的向量,该向量描述了该空间位 置与每个人员的关系,对矩阵X进行奇异值分解,得到两个正交矩阵和一个对角矩阵:其中〇 i,. . .,〇 ^皮称为奇异值,u p . . .,%和V p . . .,V1被称为左奇异向量和右奇异 向量,当选择k个最大的奇异值,和它们对应的U与V中的向量相乘,则能得到一个X矩阵 的k阶近似,此时该矩阵和X矩阵相比有着最小误差,且将空间位置向量和轨迹向量映射 到语义空间,用G表示矩阵Vt的第i列向量,则向量与含有k个奇异值的矩阵相乘,实现 从高维空间到低维空间的一个变换,这种变化用以下公式表示:Xfc =仏心以',基于奇异值 分解,在低维空间比较两个重点人员的轨迹相似度,计算向量与4 ?引的距离即可得 出。3. 根据权利要求1所述的一种基于空间轨迹大数据分析的人员管控方法,其特征在于 所述聚类算法采用k-means方法,K-means需要优化的目标函数如下: J =Ekrnk*D(xn,Uk),其中1^在数据点xn被归类到第k类的时候为1,否则为0, D(xn,yk)表示数据点Xn和第k类的中心y k的距离,本实施例中D(xn,yk)采用余弦距离其中xn>i和y ^分别表示向量xjP y k的第i个元素。4. 一种基于空间轨迹大数据分析的人员管控系统,其特征在于设有数据库单元、初级 用户指定参数单元、空间轨迹数据提取单元、轨迹数据向量化单元、潜语义分析单元、聚类 单元、次级用户指定参数单元、结果输出单元,其中数据库单元和初级用户指定参数单元的 输出送入空间轨迹数据提取单元的输入端,空间轨迹数据提取单元与轨迹数据向量化单 元、潜语义分析单元、聚类单元、结果输出单元依次串接,次级用户指定参数单元的输出端 送入聚类单元,其中 数据库单元主要用于为分析提供原始数据,数据库单元中包含了多个公安基础数据 库,包括人员轨迹数本文档来自技高网
...

【技术保护点】
一种基于空间轨迹大数据分析的人员管控方法,其特征在于包括以下步骤:步骤1:重点人员轨迹数据抽取,对用户指定的重点人员、空间区域以及时间范围,根据身份证号从多个数据库查询该人员的轨迹地址信息;根据轨迹地址名称,从地址库中找到对应的地理经纬度坐标,最终每个重点人员都可以表示为一个对应的地理坐标序列;步骤2:轨迹数据向量化,对用户指定的空间区域进行网格化处理,对每个网格进行编号;然后根据第一步提取的坐标信息,对每个重点人员的轨迹序列进行基于网格序号的直方图统计,重点人员在某个网格范围内出现一次,那么该网格对应的直方图计数加一,最终每个重点人员都可以表示为一个向量;步骤3:对轨迹模式进行潜语义分析,将一批重点人员的轨迹向量表示为一个矩阵,其中矩阵的每一列表示一个重点人员的轨迹,每一行表示用户指定的空间区域的一个网格,矩阵的一个元素表示某个重点人员在该网格范围内出现的次数,对矩阵进行奇异值分解,然后降维重建矩阵,重建后的矩阵即为重点人员轨迹模式的潜在语义矩阵;步骤4:对重点人员进行聚类,根据前一步获得的潜在语义矩阵,使用k‑means方法对重点人员进行聚类处理;步骤5:根据聚类处理结果分配管控任务。...

【技术特征摘要】

【专利技术属性】
技术研发人员:孙圣鹏张玉超纪圣华
申请(专利权)人:威海北洋电气集团股份有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1