一种基于行为分析的高危人员群体识别算法制造技术

技术编号:26506679 阅读:18 留言:0更新日期:2020-11-27 15:34
本发明专利技术公开了一种基于行为分析的高危人员群体识别算法,包括提取已有的犯罪资料样本;基于犯罪资料样本提取不同的标签;基于所有犯罪资料样本统计各个标签的数量并进行评估分数评估;提取并整理待识别群体资料并获取评估分数;基于犯罪资料样本的所有标签的评估分数以及加权值,基于待识别群体资料区别出高风险人员;对高风险人员的活动信息进行在线监测;基于活动信息修正评估分数并重新判断危害级别,从而可以更加准确地掌握高风险人员的实际情况,无须人力蹲守和定时对高风险人员进行探查,可以全天24小时运转,从而解决现有人口管理以人为主的识别模式效果较差的问题。

【技术实现步骤摘要】
一种基于行为分析的高危人员群体识别算法
本专利技术涉及信息处理
,尤其涉及一种基于行为分析的高危人员群体识别算法。
技术介绍
“治安高危人员”指对社会治安秩序和公共安全有现存或潜在危害的人群。识别和监控这类人群需要对大量普通人群筛查、分析;同时对经过筛查后确定为“治安高危人员”的人群进行监控也是一个庞大、繁复的工作。通常,筛查和监控此类人员主要依赖于群众举报和公安部门留存的记录,这种方法往往效率低、实效性差、耗费大量人力。在公安派出所的人口管理中,存在多种犯罪违法嫌疑并且需要进行监控,如果仅仅依靠人力的话,实际效果会很差。
技术实现思路
本专利技术的目的在于提供一种基于行为分析的高危人员群体识别算法,旨在解决现有人口管理以人为主的识别模式效果较差的问题。为实现上述目的,本专利技术提供了一种基于行为分析的高危人员群体识别算法,包括提取已有的犯罪资料样本;基于犯罪资料样本提取不同的标签;基于所有犯罪资料样本统计各个标签的数量并进行评估分数评估;提取并整理待识别群体资料并获取评估分数;基于待识别群体资料的所有标签的评估分数以及加权值判断危害级别,区别出高风险人员;对高风险人员的活动信息进行在线监测;基于活动信息修正评估分数并重新判断危害级别。其中,所述标签具体是指年龄、家庭、个人收入、生活地区、婚姻状况、人口密度和教育程度。其中,所述统计各个标签的数量并进行评估分数评估的具体步骤是:对各个标签进行分段;统计各个分段的标签数量,得到特征量;计算特征量与总资料样本数量的比值为评估分数。其中,所述基于犯罪资料样本的所有标签的评估分数以及加权值,基于待识别群体资料区别出高风险人员的具体步骤是:将犯罪资料样本的所有标签进行无量纲化处理;对处理后的数据进行主成分分析,使用方差最大化旋转;写出主因子得分和每个主因子的方程贡献率并求出指标权重,基于待识别群体资料各个标签的评估分数和指标权重的乘积求和,得到危害系数;基于危害系数对危害级别进行判断。其中,所述对高风险人员的活动信息进行在线监测的具体步骤是:通过银行支付系统对存款的变化比率进行监测,得到实际个人收入;通过手机GPS定位系统对活动半径进行监测,并与以往的活动半径进行比较,得到与活动区域中心的偏心值。其中,所述基于活动信息对加权值进行修正的具体步骤是:基于实际个人收入重新计算危害级别;将偏心值带入生活地区而重新计算危害级别。本专利技术的一种基于行为分析的高危人员群体识别算法,从公安局犯罪档案中,对满足条件的犯罪资料进行筛选,并整理出某一类型犯罪的档案资料,然后从资料中选出一些标签,比如年龄、个人收入、教育程度等,然后对标签按相应的特征进行分段而得到特征量,特征量与总资料样本数量的比值为评估分数。然后对需要进行识别的群体资料进行收集和整理,整理成和前面标签相匹配的资料形式,并获取评估分数。为了确认各个因素对犯罪行为的贡献,需要确认各个标签所占的权重。将数据标准化,利用标准化后的数据进行分析,对处理后的数据进行主成分分析,使用方差最大化旋转。具体步骤是确定主成分在各线性组合中的系数;确定各标签在综合得分模型中的系数,然后求出指标权重,对各个标签的评估分数和指标权重的乘积求和,得到危害系数;基于危害系数对危害级别进行判断,最终结合实时的活动信息对个人的危害级别进行修正,从而可以更加准确地掌握高风险人员的实际情况,无须人力蹲守和定时对高风险人员进行探查,可以全天24小时运转,从而解决现有人口管理以人为主的识别模式效果较差的问题。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术的一种基于行为分析的高危人员群体识别算法的流程图;图2是本专利技术的基于所有标签的评估分数以及加权值判断危害级别的流程图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。请参阅图1,本专利技术提供一种基于行为分析的高危人员群体识别算法,包括:S101提取已有的犯罪资料样本;从公安局犯罪档案中,对满足条件的犯罪资料进行筛选,并整理出某一类型犯罪的档案资料。S102基于犯罪资料样本提取不同的标签;所述标签具体是指年龄、家庭、个人收入、生活地区、婚姻状况、人口密度和教育程度。不同年龄段的人由于心理的发展阶段不同,犯罪几率是不同的,而家庭可以分为单亲家庭、孤儿和正常家庭这三种,对个人的影响也是很大的,个人收入和支出的不平衡也容易导致犯罪,某些生活地区生活较为贫穷且没有基本保障,或者人口密度较大,极为容易制造矛盾从而容易导致犯罪的发生;另外教育程度的高低往往和犯罪率呈相反的趋势,而达到已婚年龄却长期未婚的也有可能造成心理上的压抑而导致犯罪,因此需要综合这几个方面对潜在人员进行分析。S103基于所有犯罪资料样本统计各个标签的数量并进行评估分数评估;具体的步骤是:对各个标签进行分段;统计各个分段的标签数量,得到特征量;特征量与总资料样本数量的比值为评估分数。以有数值的年龄为例,可以设置五年为一个共同特征段,可以得到分段如[15,20]、[21,25]、[26,30]、[31,35]、[36,40]、[41,45]、[45,50],若整个犯罪资料样本的数量为A,在[15,20]的样本数量为B,则评估分数为B/A,可以衡量当前年龄段的犯罪概率;而没有数值的家庭、婚姻情况则可以用0、1、2这样的数来代表状态,并以相同的方式得到相应的评估分数,比如0状态下的评估分数为C/D。S104提取并整理待识别群体资料并获取评估分数;对需要进行识别的群体资料进行收集和整理,整理成和前面标签相匹配的资料形式,然后基于步骤S103获取评估分数,比如待识别群体的某份资料年龄为16,则年龄的评估分数为B/A,家庭状态为0,则评估分数为C/D。S105基于犯罪资料样本的所有标签的评估分数以及加权值,基于待识别群体资料区别出高风险人员;请参阅图2,具体步骤是:S201将犯罪资料样本的所有标签进行无量纲化处理;为了确认各个因素对犯罪行为的贡献,需要确认各个标签所占的权重。但各个标签之间由于计量单位和数量级的不尽相同,从而使得各指标间不具有可比性。在数据分析之前,通常需要先将数据标准化,利用标准化后的数据进行分析。这里采用标准化方法进行无量纲处理,以年龄X为例,每个年龄样本设为Xi,总样本数为N,标准值为a,则标准化计算方式为:其中,为年龄样本的平均值;为年龄样本的标准差。而家庭,生活地区等没有具体的值而是分离的状态的标签则可以在区间[0,本文档来自技高网...

【技术保护点】
1.一种基于行为分析的高危人员群体识别算法,其特征在于,包括:/n提取已有的犯罪资料样本;/n基于犯罪资料样本提取不同的标签;/n基于所有犯罪资料样本统计各个标签的数量并进行评估分数评估;/n提取并整理待识别群体资料并获取评估分数;/n基于犯罪资料样本的所有标签的评估分数以及加权值,基于待识别群体资料区别出高风险人员;/n对高风险人员的活动信息进行在线监测;/n基于活动信息修正评估分数并重新判断危害级别。/n

【技术特征摘要】
1.一种基于行为分析的高危人员群体识别算法,其特征在于,包括:
提取已有的犯罪资料样本;
基于犯罪资料样本提取不同的标签;
基于所有犯罪资料样本统计各个标签的数量并进行评估分数评估;
提取并整理待识别群体资料并获取评估分数;
基于犯罪资料样本的所有标签的评估分数以及加权值,基于待识别群体资料区别出高风险人员;
对高风险人员的活动信息进行在线监测;
基于活动信息修正评估分数并重新判断危害级别。


2.如权利要求1所述的一种基于行为分析的高危人员群体识别算法,其特征在于,
所述标签具体是指年龄、家庭、个人收入、生活地区、婚姻状况、人口密度和教育程度。


3.如权利要求2所述的一种基于行为分析的高危人员群体识别算法,其特征在于,所述统计各个标签的数量并进行评估分数评估的具体步骤是:
对各个标签进行分段;
统计各个分段的标签数量,得到特征量;
计算特征量与总资料样本数量的比值为评估分数。


4.如权利要求1所述的一种基于行为分析的高危人员群...

【专利技术属性】
技术研发人员:李晓明白江李楠楠
申请(专利权)人:新疆鼎盾量子信息技术有限公司
类型:发明
国别省市:新疆;65

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1