一种基于融合时空轨迹的重点人员风险评估方法技术

技术编号:26379167 阅读:24 留言:0更新日期:2020-11-19 23:47
本发明专利技术提供一种基于融合时空轨迹的重点人员风险评估方法,包含步骤:S1、筛选、预处理重点人员的静态信息数据,得到重点人员的静态特征;S2、融合重点人员的人像时空轨迹数据和手机三码时空轨迹数据得到融合时空轨迹数据;S3、提取融合时空轨迹数据的行为特征并进行特征衍生,得到重点人员的动态特征;S4、删选得到有效特征并进行特征编码;S5、将有效特征的特征编码输入梯度提升决策树模型,得到对应静态、动态特征的重要性评分;S6、通过重要性评分高于设定评分阈值的静态、动态特征的特征编码值训练异构深度神经网络模型;通过训练好的该异构深度神经网络模型给出重点人员的风险评分。

【技术实现步骤摘要】
一种基于融合时空轨迹的重点人员风险评估方法
本专利技术涉及公安重点人员管控领域,尤其涉及一种基于融合时空轨迹的重点人员风险评估方法。
技术介绍
重点人员是由公安机关重点管理的人员。通过管控重点人员为公安机关日常工作提供重要信息来源,是公安机关基层的一项重要基础工作。对重点人员进行管理,可以提前预防、发现和打击违法犯罪行为,挽救有违法犯罪倾向的人员,消除社会治安隐患。建立有效的重点人员风险管理体制,能够有效减少犯罪率,维护社会稳定。传统的公安机关对于重点人员的管控模式主要是通过谈话、走访等方式了解到该重点人员的历史信息、日常活动信息,基于业务规则对获取的信息进行评估,借助专家经验来判断该人员是否列管或撤管。目前,已经发展到基于大数据、专家经验和机器学习算法建立重点人口风险评估系统来识别重点人员。现有技术中,主要通过录入重点人员身份信息、通过访谈等手段采集重点人员日常行为数据,利用大数据挖掘发现犯罪发生的风险要素,并结合业务规则和专家经验的评分系统评估重点人员的风险系数。但目前的做法仍然对基层警力造成大量负担,且难以适应不断升级的犯罪行为。近年来,随着人脸识别技术的快速发展以及各省市“天网工程”、“雪亮工程”等建设不断铺开和落地,尤其是基于人像特征值聚类技术的不断成熟,许多省市已建成“一人一档”的人像大数据系统。城市的WIFI探针、伪基站能够采集大量的手机三码(IMEI、IMSI、MAC地址)数据。利用这些数据,能够有效刻画重点人员的行为模式进而分析其行为带来的风险性。然而对于MAC、IMSI、IMEI等时空轨迹,虽然具备一定的稠密程度,考虑到存在一人多卡、手机冒用、手机更换等情况,难以根据IMSI、MAC信息准确确定手机持有人身份。而对于人像轨迹,尽管能够较为准确地确认对象身份,但由于遮挡、侧面、背面、光照和设备数量等客观条件的限制,数据较稀疏,因此对重点人员的管控效果比较有限。
技术实现思路
本专利技术的目的是提供一种基于融合时空轨迹的重点人员风险评估方法,首先通过筛选、预处理重点人员的静态信息数据得到对应的静态特征;接着从多源、异构的时空轨迹数据中,基于广义最长公共子串算法进行时空轨迹融合,得到重点人员的融合时空轨迹数据;然后挖掘融合时空轨迹数据中的重点人员行为模式,得到对应的的动态特征;进一步通过决策树筛选重要度高的静态、动态特征用于训练异构深度神经网络模型;最后训练好的异构深度神经网络模型为重点人员进行风险评估。本专利技术能客观多源地衡量重点人员行为带来的风险。对重点人员的风险评估结果兼顾了稳定性、准确度和可解释性;同时,本专利技术不需要人工调参,更具便利性。为了达到上述目的,本专利技术提供一种基于融合时空轨迹的重点人员风险评估方法,包含步骤:S1、筛选重点人员的静态信息数据,并对筛选后的静态信息数据进行预处理得到重点人员的静态特征;S2、获取重点人员的人像时空轨迹数据和手机三码时空轨迹数据,基于广义最长公共子串算法(C_LCS)融合所述人像时空轨迹数据、手机三码时空轨迹数据,得到融合时空轨迹数据;S3、提取所述融合时空轨迹数据的行为特征并进行特征衍生,得到重点人员的动态特征;S4、删选得到静态特征中的有效静态特征,将所述动态特征、有效静态特征作为有效特征并进行特征编码;S5、将有效特征的特征编码输入梯度提升决策树模型,通过所述梯度提升决策树模型得到对应静态、动态特征的重要性评分;S6、通过重要性评分高于设定评分阈值的静态、动态特征的特征编码值训练异构深度神经网络模型;通过训练好的该异构深度神经网络模型给出重点人员的风险评分。步骤S1具体包含:S11、获取重点人员的静态信息数据,包含:重点人员出生日期、性别、上网记录、案事件记录、盘问记录、访谈记录、住店记录;S12、对所述静态信息数据进行去缺失值预处理;S13、人工为由步骤S12所得的静态信息数据设置类别标签,将惯犯、屡犯、涉毒的重点人员的静态信息数据的标签值设为1,该静态信息数据作为正样本数据;其余静态信息数据的标签值为0,作为负样本数据;通过SMOTE方法对所述正样本数据进行过采样预处理;S14、将步骤S13预处理后的正样本数据作为重点人员的静态特征。步骤S2中所述获取重点人员的人像时空轨迹数据和手机三码时空轨迹数据具体包含:S21、通过图像采集设备捕获重点人员的图像,提取该图像中的人脸特征生成对应的人脸特征值;根据所述人脸特征值比对人像档案,获取唯一识别该重点人员的id号;所述人像档案中存储有重点人员的人脸特征值及对应的id号;S22、生成重点人员的人像时空轨迹数据,包含:重点人员的id号、图像的捕获时间、图像采集设备经度、图像采集设备纬度;S23、通过伪基站采集重点人员的手机通讯信息,获取对应的手机三码数据;生成重点人员的手机三码时空轨迹数据,包含:手机三码,伪基站的采集时间,伪基站经度,伪基站维度;S24、去除所述人像时空轨迹数据、手机三码时空轨迹数据中的噪声数据。步骤S2中所述融合所述人像时空轨迹数据、手机三码时空轨迹数据,具体包含:S25、通过Dev-DBSCAN算法基于图像采集设备的经度、维度对所述图像采集设备进行聚类;S26、基于同一个聚类中的图像采集设备在设定时段内获取的人像时空轨迹数据建立第一时空轨迹Ta={Pa1,…,Pai},Pak为Ta的一个轨迹点,对应一个人像时空轨迹数据;i为Ta所包含的轨迹点总数,k∈[1,i];基于所述设定时段内的手机三码时空轨迹数据建立第二时空轨迹Tb={Pb1,…,Pbj};Pbl为Tb的一个轨迹点,对应一个手机三码时空轨迹数据;j为Tb第二时空轨迹所包含的手机三码时空轨迹数据总数,l∈[1,j];基于第一时空轨迹Ta、第二时空轨迹Tb建立时空轨迹对;S27、基于Pak中图像采集设备经纬度,以及Pbl中伪基站经纬度,计算第一时空轨迹Ta、第二时空轨迹Tb的时空相似度;将时空相似度高于设定相似度阈值的第一时空轨迹Ta、第二时空轨迹Tb融合为同一重点人员的融合时空轨迹TR=Ta∪Tb。步骤S3具体包含:S31、基于所述融合时空轨迹TR中图像采集设备经、纬度和伪基站经、纬度,提取重点人员行为特征,包含高频出现地点、在各时间段内的出现地分布情况、出现在敏感区域次数、两地徘徊次数、时空异常点;S32、基于所述时空异常点、高频出现点、以及行为规律衍生出重点人员的动态特征;所述动态特征包括异常行为分、昼伏夜出、出入敏感区域次数、是否徘徊、轨迹离散度。步骤S4具体包含:S41、对每类静态特征的标签值进行统频,计算不同的标签值在该类静态特征的百分比,若该百分比落在设定阈值范围内,则该类静态特征为有效静态特征;否则,为无效静态特征;将有效静态特征和动态特征作为有效特征;S42、基于皮尔森相关系数,计算任意两个连续型有效特征之间的两两相关性;若相关性超过设定的相关阈值,则只保留所述两个连续型有效特征其中的一个连续型本文档来自技高网
...

【技术保护点】
1.一种基于融合时空轨迹的重点人员风险评估方法,其特征在于,包含步骤:/nS1、筛选重点人员的静态信息数据,并对筛选后的静态信息数据进行预处理得到重点人员的静态特征;/nS2、获取重点人员的人像时空轨迹数据和手机三码时空轨迹数据,基于广义最长公共子串算法融合所述人像时空轨迹数据、手机三码时空轨迹数据,得到融合时空轨迹数据;/nS3、提取所述融合时空轨迹数据的行为特征并进行特征衍生,得到重点人员的动态特征;/nS4、删选得到静态特征中的有效静态特征,将所述动态特征、有效静态特征作为有效特征并进行特征编码;/nS5、将有效特征的特征编码输入梯度提升决策树模型,通过所述梯度提升决策树模型得到对应静态、动态特征的重要性评分;/nS6、通过重要性评分高于设定评分阈值的静态、动态特征的特征编码值训练异构深度神经网络模型;通过训练好的该异构深度神经网络模型给出重点人员的风险评分。/n

【技术特征摘要】
1.一种基于融合时空轨迹的重点人员风险评估方法,其特征在于,包含步骤:
S1、筛选重点人员的静态信息数据,并对筛选后的静态信息数据进行预处理得到重点人员的静态特征;
S2、获取重点人员的人像时空轨迹数据和手机三码时空轨迹数据,基于广义最长公共子串算法融合所述人像时空轨迹数据、手机三码时空轨迹数据,得到融合时空轨迹数据;
S3、提取所述融合时空轨迹数据的行为特征并进行特征衍生,得到重点人员的动态特征;
S4、删选得到静态特征中的有效静态特征,将所述动态特征、有效静态特征作为有效特征并进行特征编码;
S5、将有效特征的特征编码输入梯度提升决策树模型,通过所述梯度提升决策树模型得到对应静态、动态特征的重要性评分;
S6、通过重要性评分高于设定评分阈值的静态、动态特征的特征编码值训练异构深度神经网络模型;通过训练好的该异构深度神经网络模型给出重点人员的风险评分。


2.如权利要求1所述的基于融合时空轨迹的重点人员风险评估方法,其特征在于,步骤S1具体包含:
S11、获取重点人员的静态信息数据,包含:重点人员出生日期、性别、上网记录、案事件记录、盘问记录、访谈记录、住店记录;
S12、对所述静态信息数据进行去缺失值预处理;
S13、人工为由步骤S12所得的静态信息数据设置类别标签,将惯犯、屡犯、涉毒的重点人员的静态信息数据的标签值设为1,该静态信息数据作为正样本数据;其余静态信息数据的标签值为0,作为负样本数据;通过SMOTE方法对所述正样本数据进行过采样预处理;
S14、将步骤S13预处理后的正样本数据作为重点人员的静态特征。


3.如权利要求1所述的基于融合时空轨迹的重点人员风险评估方法,其特征在于,步骤S2中所述获取重点人员的人像时空轨迹数据和手机三码时空轨迹数据具体包含:
S21、通过图像采集设备捕获重点人员的图像,提取该图像中的人脸特征生成对应的人脸特征值;根据所述人脸特征值比对人像档案,获取唯一识别该重点人员的id号;所述人像档案中存储有重点人员的人脸特征值及对应的id号;
S22、生成重点人员的人像时空轨迹数据,包含:重点人员的id号、图像的捕获时间、图像采集设备经度、图像采集设备纬度;
S23、通过伪基站采集重点人员的手机通讯信息,获取对应的手机三码数据;生成重点人员的手机三码时空轨迹数据,包含:手机三码,伪基站的采集时间,伪基站经度,伪基站维度;
S24、去除所述人像时空轨迹数据、手机三码时空轨迹数据中的噪声数据。


4.如权利要求3所述的基于融合时空轨迹的重点人员风险评估方法,其特征在于,步骤S2中所述融合所述人像时空轨迹数据、手机三码时空轨迹数据,具体包含:
S25、通过Dev-DBSCAN算法基于图像采集设备的经度、维度对所述图像采集设备进行聚类;
S26、基于同一个聚类中的图像采集设备在设定时段内获取的人像时空轨迹数据建立第一时空轨迹Ta={Pa1,…,Pai},Pak为Ta的一个轨迹点,对应一个人像时空轨迹数据;i为Ta所包含的轨迹点总数,k∈[1,i];
基于所述设定时段内的手机三码时空轨迹数据建立第二时空轨迹Tb={Pb1,…,Pbj};Pbl为Tb的一个轨迹点,对应一个手机三码时空轨迹数据;j为Tb第二时空轨迹所包含的手机三码时空轨迹数据总数,l∈[1,j];
基于第一时空轨迹Ta、第二时空轨迹Tb建立时空轨迹对;
S27、基于Pak中图像采集设备经纬度,以及Pbl中伪基站经纬度,计算第一时空轨迹Ta、第二时空轨迹Tb的时空相似度;将时空相似度高于设定相似度阈值...

【专利技术属性】
技术研发人员:郑志骏韩德志
申请(专利权)人:上海海事大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1