一种面向大型活动公安系统警卫安保的多源异构数据分析方法技术方案

技术编号：26420073 阅读：68 留言：0更新日期：2020-11-20 14:15

本发明专利技术公开了一种面向大型活动公安系统警卫安保的多源异构数据分析方法，通过深度学习的方式来进行文本情感分析，犯罪倾向人员画像，犯罪倾向人员轨迹分析与文本信息提取。首先对网络社交文本进行情感分析，筛选出发布不良言论的账户，对该账户所发布的全部内容与搜索记录进行分析，得出账户持有人的籍贯，年龄，文化程度等信息。对近期频繁往返于活动举办地与倾向人员籍贯地的重点人员进行轨迹分析与文本情报提取，以期有效打击犯罪，降低一线干警工作量，有效保障大型活动的顺利召开，并为公安系统犯罪预防方法的进一步研究提供了解决思路。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向大型活动公安系统警卫安保的多源异构数据分析方法
本专利技术是一种基于深度学习面向大型活动公安系统警卫安保的多源异构数据分析方法，主要用于重大活动安保，案件侦破辅助等相关工作，属于公共安全大数据挖掘和分析领域。
技术介绍
随着我国国际地位的提高，外事活动日渐频繁，如何保证高规格重大活动中的安保工作已经成为了公安警卫部门的难题。目前大型活动安全保卫工作仍以传统的人海战术为主，被动防御各种突发情况。随着安全形势的复杂与犯罪手段的多样化，这种模式已经无法满足实际的工作需要。首先，化学技术的日臻完善已经使得有毒物质具有难以检测，隐蔽性高，杀伤力大等特点；其次，恐怖主义势力在世界范围内日益猖獗，时刻威胁着世界人民的安全；安全态势纷繁复杂。我国公安工作信息化的推进使得积累了大量的公安数据，我国互联网产业的发展也积累了海量的用户数据。随着人工智能时代的来临，如何有效让数据服务于公安系统，成为了公安工作信息化建设未来发展的趋势。本方法将主要针对公共安全犯罪预防系统的构建开展工作。大数据分析技术在安保警卫新模式中的应用有利于数据隐藏信息的发掘，结合案件的人，事，地，物，组织等要素建立预警模型，为犯罪行为预测与预防提供科学的依据。构建多源异构数据分析方法，建立警务数据分析模型，将犯罪行为扼杀在摇篮之中，降低一线干警工作量，提高效率，尽最大可能将风险降到最低，为高规格重要活动的顺利进行提供坚实后盾，为领导层提供科学的决策辅助，摆脱经验主义模式，以数据为基础，科学决策，降低误判率，提升效率。有效保障高规格重大活动的顺利...

【技术保护点】
1.一种面向大型活动公安系统警卫安保的多源异构数据分析方法，其特征在于：包括以下步骤：/n步骤1：对网络社交账户所发布的文本内容进行情感分析，找出具有犯罪倾向的账户；利用Keras框架下的LSTM算法对网络社交文本数据进行情感评估，初步筛选出犯罪倾向人群；/n步骤2：对犯罪倾向人员进行画像，利用Tensorflow框架下的LSTM算法对步骤1筛选出的重点账户内容与重点账户搜索记录进行中文文本多标签分类，对初步筛选出的犯罪倾向人群的学历、年龄、性别和籍贯信息进行推断；/n步骤3：犯罪倾向人员轨迹分析与信息抽取模型；采用DBSCAN算法对犯罪倾向人员进行轨迹分析以及利用Python对社交账户进行信息抽取，对于频繁往返于目标地点的人群进行轨迹点聚类，结合轨迹产生时间进行综合分析；对社交账户进行监控，利用Python语言进行编程，对目标账户的聊天记录信息进行信息抽取得到情报。/n

【技术特征摘要】
1.一种面向大型活动公安系统警卫安保的多源异构数据分析方法，其特征在于：包括以下步骤：
步骤1：对网络社交账户所发布的文本内容进行情感分析，找出具有犯罪倾向的账户；利用Keras框架下的LSTM算法对网络社交文本数据进行情感评估，初步筛选出犯罪倾向人群；
步骤2：对犯罪倾向人员进行画像，利用Tensorflow框架下的LSTM算法对步骤1筛选出的重点账户内容与重点账户搜索记录进行中文文本多标签分类，对初步筛选出的犯罪倾向人群的学历、年龄、性别和籍贯信息进行推断；
步骤3：犯罪倾向人员轨迹分析与信息抽取模型；采用DBSCAN算法对犯罪倾向人员进行轨迹分析以及利用Python对社交账户进行信息抽取，对于频繁往返于目标地点的人群进行轨迹点聚类，结合轨迹产生时间进行综合分析；对社交账户进行监控，利用Python语言进行编程，对目标账户的聊天记录信息进行信息抽取得到情报。

2.根据权利要求1所述的一种面向大型活动公安系统警卫安保的多源异构数据分析方法，其特征在于：对网络社交账户所发布的文本内容进行情感分析，找出具有犯罪倾向的账户，具体方法如下：
文本向量化：Word2Vec算法在捕捉语境信息的同时压缩数据规模；Word2Vec实际上是两种不同的方法：ContinuousBagofWords和Skip-gram；CBOW的目标是根据上下文来预测当前词语；Skip-gram根据当前词语来预测上下文；起初，每个单词都是一个随机的N维向量；经过训练之后，Word2Vec算法利用CBOW或者Skip-gram的方法获得每个单词的最优向量即词向量；词向量已经捕捉到上下文信息；利用基本代数公式来发现单词之间的关系；这些单词向量代替词袋模型用来预测未知数据的情感状况；
LSTM网络将词向量送入神经网络中，LSTM共有两条线，一条明线，包含当前时刻的数据流；一条暗线，包含这个细胞本身的记忆流；在“输入门”中，根据当前的数据流来控制接受细胞记忆的影响；接着，在“遗忘门”里，更新这个细胞的记忆和数据流；然后在“输出门”里产生输出更新后的记忆和数据流；
算法流程：加载训练文件并进行中文分词；创...

【专利技术属性】
技术研发人员：李晓理，卜坤，王康，
申请(专利权)人：北京工业大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人