当前位置: 首页 > 专利查询>北京大学专利>正文

一种基于数据挖掘和情景计算的社区风险预警方法和系统技术方案

技术编号:30640201 阅读:21 留言:0更新日期:2021-11-04 00:34
本申请涉及风险预警技术领域,更为具体来说,本申请涉及一种基于数据挖掘和情景计算的社区风险预警方法和系统。所述方法包括:获取多视图样本;将所述多视图样本输入到训练好的神经网络中进行带约束的表达学习,得到所述多视图样本在完整异常信息空间中的表达;根据所述多视图样本在完整异常信息空间中的表达计算每个样本的属性异常值和类别异常值;将所述每个样本的属性异常值和类别异常值加和得到每个样本的综合异常值。本申请所述预警方法可实现快速地检测社区的多视图样本,即使在多视图样本较多时,也能快速计算出每个样本的属性异常值和类别异常值,从而获得更好的检测效果,提升了社区风险预警准确度和效率。提升了社区风险预警准确度和效率。提升了社区风险预警准确度和效率。

【技术实现步骤摘要】
一种基于数据挖掘和情景计算的社区风险预警方法和系统


[0001]本申请涉及风险预警
,更为具体来说,本申请涉及一种基于数据挖掘和情景计算的社区风险预警方法和系统。

技术介绍

[0002]在实际生产中,关于同一事物的数据,有时会来源于不同的渠道,或者对同一份数据会采用不同的特征提取方式,通过这样的方法,我们获得的多组数据被称为多视图数据。近些年来,由于越来越多的多视图数据的产生,人们对于多视图数据的研究也越来越多,产生了很多基于多视图数据的算法。而在我们的社区风险预警问题中,社区往往会安装一些传感器用于检测数据,从不同的传感器获取到的多组数据,便是多视图数据。
[0003]在多视图数据中,需要检测的异常点可以分为三类,分别叫做属性异常点、类别异常点和类别

属性异常点。属性异常点指在各个视图内部都表现得与其他样本行为不一致的异常点;类别异常点指的是在不同的视图中邻居结构不同的异常点;而类别

属性异常点,是前两者的混合,在某些视图下表现为属性异常点,在其他视图下表现为类别异常点。属性异常点是常见的异常点,而类别异常点和类别

属性异常点则容易被忽略,但是检测出它们,是非常有意义的。
[0004]在社区风险预测预警问题中,一个社区的传感器数量通常不少,因为会有较大的视图数量,而大部分现有的多视图异常检测方法,采用成对的方式进行检测,随着视图数量的上升,计算量显著提高,不利于快速地检测。并且视图较多时,需要对视图信息进行提取与整合,才能获得更好的检测效果。

技术实现思路

[0005]基于上述问题,本专利技术目的在于对多视图样本进行表达学习,表达学习后形成完整异常信息空间,结合多视图样本在完整异常信息空间中的表达计算每个样本的属性异常值和类别异常值,进而实现对社区异常点的预警,以达到更快的效率和更好的效果。
[0006]为实现上述技术目的,本申请提供了一种基于数据挖掘和情景计算的社区风险预警方法,包括以下步骤:
[0007]获取社区多视图样本;
[0008]将所述社区多视图样本输入到训练好的神经网络中进行带约束的表达学习,得到所述社区多视图样本在完整异常信息空间中的表达;
[0009]根据所述社区多视图样本在完整异常信息空间中的表达计算每个样本的属性异常值和类别异常值;
[0010]将所述每个样本的属性异常值和类别异常值加和得到每个样本的综合异常值,将所述综合异常值从大到小进行排序,给出相应预警信息。
[0011]具体地,所述神经网络包括公共神经网络和偏差神经网络。
[0012]具体地,计算样本的属性异常值的方法为:
[0013]先计算第i个样本的第v个视图的属性异常值;
[0014]再计算第i个样本总的属性异常值。
[0015]进一步地,所述计算第i个样本的第v个视图的属性异常值的方法为:
[0016][0017]其中,h
iv
表示第i个样本的第v个视图在完整异常信息空间中的表达,H
v
表示从第v个视图映射到完整异常信息空间中的所有样本的集合,表示h
iv
到H
v
第k近临距离;
[0018]所述计算第i个样本总的属性异常值的方法为:
[0019]其中V表示第i个样本的视图总数。
[0020]优选地,所述神经网络的训练步骤为:
[0021]对所述神经网络中的参数进行初始化及初始化迭代次数;
[0022]建立所述神经网络的损失方法;
[0023]将训练样本一次性输入到所述神经网络中进行训练,获得训练样本在完整异常信息空间中的表达;
[0024]计算整体的视图内误差和视图间误差,以得到总误差量,再利用反向传播技术更新神经网络中的全部参数;
[0025]当训练次数达到预设次数,终止训练。
[0026]优选地,建立所述神经网络的损失方法包括:
[0027]定义第v个视图的视图内损失;
[0028]定义所有视图的视图内损失之和;
[0029]定义视图间的损失。
[0030]选择性地,将训练样本一次性输入到所述神经网络中进行训练之前还包括对所述训练样本的整合处理,得到包含异常信息的训练样本。
[0031]本专利技术第二方面提供一种基于数据挖掘和情景计算的社区风险预警系统,所述系统包括:
[0032]获取模块,用于获取社区多视图样本;
[0033]表达学习模块,用于将所述社区多视图样本输入到训练好的神经网络中进行带约束的表达学习,得到所述多视图样本在完整异常信息空间中的表达;
[0034]异常值计算模块,用于根据所述社区多视图样本在完整异常信息空间中的表达计算每个样本的属性异常值和类别异常值;
[0035]预警模块,用于将所述每个样本的属性异常值和类别异常值加和得到每个样本的综合异常值,根据综合异常值从大到小进行排序,给出相应预警信息。
[0036]本专利技术第三方面提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如下步骤:
[0037]获取社区多视图样本;
[0038]将所述社区多视图样本输入到训练好的神经网络中进行带约束的表达学习,得到所述社区多视图样本在完整异常信息空间中的表达;
[0039]根据所述社区多视图样本在完整异常信息空间中的表达计算每个样本的属性异常值和类别异常值;
[0040]将所述每个样本的属性异常值和类别异常值加和得到每个样本的综合异常值,将所述综合异常值从大到小进行排序,给出相应预警信息。
[0041]本专利技术第四方面提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如下步骤:
[0042]获取社区多视图样本;
[0043]将所述社区多视图样本输入到训练好的神经网络中进行带约束的表达学习,得到所述社区多视图样本在完整异常信息空间中的表达;
[0044]根据所述社区多视图样本在完整异常信息空间中的表达计算每个样本的属性异常值和类别异常值;
[0045]将所述每个样本的属性异常值和类别异常值加和得到每个样本的综合异常值,将所述综合异常值从大到小进行排序,给出相应预警信息。
[0046]本申请的有益效果为:本专利技术的基于数据挖掘和情景计算的社区风险预警方法可实现快速地检测社区的多视图样本,即使在多视图样本较多时,也能快速计算出每个样本的属性异常值和类别异常值,从而获得更好的检测效果,提升了社区风险预警准确度和效率。
附图说明
[0047]图1示出了本申请一示例性实施例的方法流程示意图;
[0048]图2示出了本申请一示例性实施例中异常点分类示意图;
[0049]图3示出了本申请一示例性实施例的神经网络结构及该神经网络表达学习过程示意图;...

【技术保护点】

【技术特征摘要】
1.一种基于数据挖掘和情景计算的社区风险预警方法,其特征在于,包括以下步骤:获取社区多视图样本;将所述社区多视图样本输入到训练好的神经网络中进行带约束的表达学习,得到所述社区多视图样本在完整异常信息空间中的表达;根据所述社区多视图样本在完整异常信息空间中的表达计算每个样本的属性异常值和类别异常值;将所述每个样本的属性异常值和类别异常值加和得到每个样本的综合异常值,将所述综合异常值从大到小进行排序,给出相应预警信息。2.根据权利要求1所述的基于数据挖掘和情景计算的社区风险预警方法,其特征在于,所述神经网络包括公共神经网络和偏差神经网络。3.根据权利要求1所述的基于数据挖掘和情景计算的社区风险预警方法,其特征在于,计算样本的属性异常值的方法为:先计算第i个样本的第v个视图的属性异常值;再计算第i个样本总的属性异常值。4.根据权利要求3所述基于数据挖掘和情景计算的社区风险预警方法,其特征在于,所述计算第i个样本的第v个视图的属性异常值的方法为:其中,h
iv
表示第i个样本的第v个视图在完整异常信息空间中的表达,H
v
表示从第v个视图映射到完整异常信息空间中的所有样本的集合,表示h
iv
到H
v
第k近临距离;所述计算第i个样本总的属性异常值的方法为:其中V表示第i个样本的视图总数。5.根据权利要求1所述基于数据挖掘和情景计算的社区风险预警方法,其特征在于,所述神经网络的训练步骤为:对所述神经网络中的参数进行初始化及初始化迭代次数;建立所述神经网络的损失方法;将训练样本一次...

【专利技术属性】
技术研发人员:陈永强季育轩
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1