【技术实现步骤摘要】
一种社会安全风险监测预警方法
[0001]本专利技术涉及一种社会安全风险监测预警方法。
技术介绍
[0002]社会安全事件的发生具有随机性与突然性,会引起一定程度的社会动荡,社会安全风险的持续监测与精准预警对于维护社会稳定非常重要。
[0003]社会安全事件种类繁多,目前对于社会安全风险监测预警的研究,大多没有对安全事件进行科学系统地分类,不能有效地预测每一类社会安全事件的状态,从而无法对社会安全综合风险进行精准的预测;另一方面,预警模型较为单一固定,缺少分级预警体系,未能实现预警模型在预测过程中根据分级预测结果进行动态调整,导致预测结果准确率降低。
[0004]因此,在对社会安全风险进行监测预警时,需要一种对安全事件进行分级分类、预警机制根据实际情况动态调整的系统性的预警方法,来增加社会安全风险预警的精准性。
技术实现思路
[0005]专利技术目的:为实现社会安全风险的自动监测与预警,提供一种社会安全风险监测预警技术方案,自动持续地爬取互联网、传感网、政务网上社会安全的有关数据,基于建立的社 ...
【技术保护点】
【技术特征摘要】
1.一种社会安全风险监测预警方法,其特征在于,包括以下步骤;步骤1、多元信息采集,建立社会安全事件结构化表征模型,对社会安全事件进行分类,确定其关键要素,实现风险数据的结构化;持续采集网络上的社会安全风险数据,采用事件语义抽取技术识别各类安全风险,根据社会安全事件结构化表征模型抽取出各类风险事件的相关信息,存入安全事件大数据库中;步骤2、风险预警,构建多级风险传导预警模型,从安全事件大数据库中获取风险数据,根据风险数据超出阈值的范围来动态调整各级指标的权重,实现各类社会安全风险以及综合风险的动态监测,并输出风险预测值;步骤3、风险态势监测,将选定时间范围内的各类社会安全风险变化趋势进行可视化,发送预警信息给相应接收端,并将风险信息在地图上展现出来。2.根据权利要求1所述的方法,其特征在于,所述多元信息采集包括如下步骤:步骤1
‑
1、采用分布式网络爬虫技术和分布式数据预处理技术,自动持续采集互联网公开的社会安全风险数据,通过动态自适应的定时接入技术,汇聚传感网和政务网的安全风险非结构化文本数据;步骤1
‑
2、根据构建的社会安全事件结构化表征模型对非结构化文本进行语义抽取和风险分类,并且提取出风险的关键要素,存入安全事件大数据库中。3.根据权利要求2所述的方法,其特征在于,步骤1
‑
2包括:步骤1
‑2‑
1、构建社会安全事件结构化表征模型,对安全事件进行分类,并确定每类事件的基本属性,将事件作为一级指标,将事件的基本属性作为二级指标;步骤1
‑2‑
2、数据清洗:针对新闻、论坛、博客这类互联网来源的数据,剔除接入信息中的广告、导航、链接及未处理的HTML脚本代码;步骤1
‑2‑
3、数据规范化:对网页和文本类数据进行规范化,将采集到的网页类型的数据以文档对象模型DOM树的格式保存,将文本类型的数据统一字符编码;步骤1
‑2‑
4、实体信息抽取:对于经过数据清洗和数据规范化的非结构化文本,采用实体库匹配、条件随机场CRF算法、规则库流水线识别出文本中与风险有关的实体,所述与风险有关的实体包括时间、地点、人物;步骤1
‑2‑
5、基于语义进行事件抽取:从文本中提取出事件的发起者、受害者、经济损失、伤亡人数,以及事件的触发词,从而将非结构化的句子转化为结构化的、规范化的事件,存入风险事件对应的数据库表中;步骤1
‑2‑
6、根据社会安全事件结构化表征模型对事件的分类,将实体、事件要素、触发词及相应事件存入风险事件对应的数据库表中。4.根据权利要求3所述的方法,其特征在于,步骤1
‑2‑
4包括:步骤1
‑2‑4‑
1,将文本与实体库进行匹配,将文本中匹配成功的词语识别为相关实体;步骤1
‑2‑4‑
2,对于实体库匹配不到的文本,建立如下4种特征模板:词特征;词性特征;英文字母、短横线及数字的组合特征;左、右边界词和中心词特征;采用条件随机场CRF模型,根据模板完成实体的匹配识别;
步骤1
‑2‑4‑
3,对于没有识别的文本,通过规则库进行实体匹配。5.根据权利要求4所述的方法,其特征在于,步骤1
‑2‑
5包括:步骤1
‑2‑5‑
1,要素抽取及触发词抽取:采用双向长短记忆Bi
‑
LSTM和条件随机场CRF模型识别要素和触发词,进行序列标注任务,给句子中的每一个词都打上相应标签,生成事件要素和触发词的抽取结果;步骤1
‑2‑5‑
2,触发词匹配事件元素:使用卷积神经网络CNN模型进行分类匹配,产生触发词与事件要素的匹配结果。6.根据权利要求5所述的方法,其特征在于,步骤2包括如下步骤:步骤2
‑
1、基于社会安全事件样本,通过熵值法确定各类安全风险事件中二级指标和一级指标的权重,确定二级指标的阈值、一级指标的阈值和综合风险阈值,根据阈值将安全风险划分为一般、较重、严重、特别严重四个等级,并存入对应的数据库表中;步骤2
‑
2、确定时间区间,从安全事件...
【专利技术属性】
技术研发人员:方婉盈,陈鹏,王妍妍,王玉坤,高菁,陈文颖,
申请(专利权)人:中国电子科技集团公司第二十八研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。