嵌入式智能终端异常数据的检测方法和嵌入式智能终端技术

技术编号:18556885 阅读:84 留言:0更新日期:2018-07-28 13:46
本发明专利技术提供了一种嵌入式智能终端异常数据的检测方法和嵌入式智能终端,该检测方法包括:接收待测数据,待测数据包含异常数据;确定待测数据中的对象,每个对象的k近邻,以及对象之间的k近邻关系;根据对象之间的k近邻关系构造k近邻有向图;根据k近邻有向图构造k‑聚类图,并对k‑聚类图中的聚类簇进行标记;当聚类簇中的部分聚类簇满足预设条件时,部分聚类簇中的待测数据作为异常数据输出。该方法能够在终端设备计算资源有限的情形下,使用图聚类方法对嵌入式智能终端环境进行小规模的异常数据挖掘,检测率较高,运行效率较高,同时减少了误报率。

【技术实现步骤摘要】
嵌入式智能终端异常数据的检测方法和嵌入式智能终端
本专利技术涉及本专利技术涉及网络安全领域,尤其涉及一种嵌入式智能终端异常数据检测方法和嵌入式智能终端。
技术介绍
随着互联网技术的不断发展,网络安全逐渐成为了一项热门,几乎每天都会产生新的安全威胁。面对这样一些规模逐渐庞大、类型变化多端的攻击,应用机器学习或数据挖掘技术对数以万计的新类型安全威胁进行训练和识别逐渐成为了主流趋势。在嵌入式环境下,需要对采集到的一些数据进行异常检测,而数据挖掘领域的许多方法,只有在数据规模较大的情形下才能显现出优势,例如神经网络,对于计算资源有限的环境,数据挖掘领域的方法显得比较复杂,且检测率较低。本专利技术的目的在于,能够在终端设备计算资源有限的情形下、采用云端辅助的方式,通过一种基于图聚类的方式在嵌入式智能终端环境中进行小规模的异常数据挖掘,检测出异常数据。与数据挖掘领域其他算法相比,便于实现,也表现出较高的检测率;终端数据的属性种类较少,运行算法效率较高;如果对检测率有更高的要求,可以请求云端协同完成;此外,该方法还改善了基于传统的K-Means的异常检测算法在用于异常检测时需要预先设定簇的个数的问题,提高了聚类算法对于任意形状的簇的聚类质量,增加了异常数据的检测率,减少了误报率。
技术实现思路
本专利技术提供了一种嵌入式智能终端异常数据检测方法和嵌入式智能终端,解决了计算资源有限环境下,进行异常数据检测检测效率低的问题。第一方面,提供了一种嵌入式智能终端异常数据的检测方法,该检测方法包括:接收待测数据,待测数据包含异常数据;确定待测数据中的对象,每个对象的k近邻,以及对象之间的k近邻关系;根据对象之间的k近邻关系构造k近邻有向图;根据k近邻有向图构造k-聚类图,并对k-聚类图中的聚类簇进行标记;当聚类簇中的部分聚类簇满足预设条件时,部分聚类簇中的待测数据作为异常数据输出。可选地,在一个可能实现的方式中,在对k-聚类图中的聚类簇进行标记之后;检测方法还包括:当聚类簇中的部分聚类簇满足预设条件时,向云端服务器发送请求消息,请求消息用于云端服务器对部分聚类簇中的待测数据进行计算,获得异常数据并输出。可选地,在一个可能实现的方式中,云端服务器对部分聚类簇中的待测数据进行计算,获得异常数据并输出,包括:云端服务器计算部分聚类簇中的待测数据基于簇的离群点因子;当部分聚类簇中的待测数据基于簇的离群点因子满足预设阈值时,确定部分聚类簇中待测数据作为异常数据输出。可选地,在一个可能实现的方式中,根据k近邻有向图构造k-聚类图,包括:根据k近邻有向图中的k-互邻居关系构造k-聚类图。第二方面,提供了一种嵌入式智能终端,嵌入式智能终端包括存储器和处理器,以及存储器中存储的计算机程序,当处理器调用存储器中的计算机程序时,处理器执行以下操作:接收待测数据,待测数据包含异常数据;处理单元确定待测数据中的对象,每个对象的k近邻,以及对象之间的k近邻关系;根据对象之间的k近邻关系构造k近邻有向图;根据k近邻有向图构造k-聚类图,并对k-聚类图中的聚类簇进行标记;当聚类簇中的部分聚类簇满足预设条件时,部分聚类簇中的待测数据作为异常数据输出。可选地,在一个可能实现的方式中,在对k-聚类图中的聚类簇进行标记之后;处理器还用于执行:当聚类簇中的部分聚类簇满足预设条件时,向云端服务器发送请求消息,请求消息用于云端服务器对部分聚类簇中的待测数据进行计算,获得异常数据并输出。可选地,在一个可能实现的方式中,云端服务器对部分聚类簇中的待测数据进行计算,获得异常数据并输出,包括:云端服务器计算部分聚类簇中的待测数据基于簇的离群点因子;当部分聚类簇中的待测数据基于簇的离群点因子满足预设阈值时,确定部分聚类簇中待测数据作为异常数据输出。可选地,在一个可能实现的方式中,根据k近邻有向图构造k-聚类图,包括:根据k近邻有向图中的k-互邻居关系构造k-聚类图。采用本专利技术技术方案提供的嵌入式智能终端异常数据检测方法和嵌入式智能终端,能够在嵌入式终端设备计算资源有限的情形下、采用云端辅助的方式,通过一种基于图聚类的方法在嵌入式智能终端环境中进行小规模的异常数据挖掘,与数据挖掘领域其他算法相比,便于实现,也表现出较高的检测率;终端数据的属性种类较少,运行算法效率较高。另外,云端协同方式辅助终端进行二次标记,减轻了终端的计算负担,提升了终端计算效率;通过采用图聚类的方式,改善了基于传统的K-Means的异常检测算法需要预先设定簇的个数的问题,提高了聚类算法对于任意形状的簇的聚类质量;聚类完毕之后采用两次标记聚类簇的方式,改善了单纯使用图聚类检测异常数据精度,同时也增加了异常数据的检测率,减少了误报率。附图说明图1为本专利技术实施例提供的一种嵌入式智能终端异常数据检测方法的流程示意图;图2为本专利技术实施例提供的一种嵌入式智能终端的结构示意图;图3为本专利技术实施例提供的一种系统结构示意图。具体实施方式本专利技术实施例提供了一种嵌入式智能终端异常数据检测方法和嵌入式智能终端,能够在终端设备计算资源有限的情形下,采用云端辅助的方式,使用图聚类方法对嵌入式智能终端环境进行小规模的异常数据挖掘,检测率较高;嵌入式智能终端数据的属性种类较少,运行算法效率较高。同时使用云端协同方式辅助嵌入式智能终端进行二次标记,减轻了嵌入式智能终端的计算负担,提升了嵌入式智能终端计算效率。另外,采用本专利技术的技术方案,改善了基于传统的K-Means的异常检测算法需要预先设定簇的个数的问题,提升了异常数据的检测率,减少了误报率。下面结合附图对本专利技术的技术方案进行描述。图1为本专利技术实施例提供的一种嵌入式智能终端异常数据检测方法的流程示意图。如图1所示,该检测方法可以包括以下步骤:S101,接收待测数据,待测数据包含异常数据。把包含异常数据的待测数据作为嵌入式智能终端的输入。在嵌入式环境中,采集到的数据属性主要包括系统资源和系统状态两类,系统资源属性可以包括:CPU占有率、内存占用率、磁盘空间、网络发送流量,网络接收流量、蓝牙状态、WIFI状态、电池信息等等;系统状态属性可以包括:信号强度、进程数量、安装的应用程序数量、正在运行的应用程序数量等等。每一种属性都可以组成待采集数据的一个维度,只要维度大于1,都可以使用本方法。S102,确定待测数据中的对象,每个对象的k近邻,以及对象之间的k近邻关系。S103,根据对象之间的k近邻关系构造k近邻有向图。k近邻有向图是指,对于一个有向图G=(W,E),其中W是图中所有点的集合W={w1,w2,…wn,},E是图中所有边的集合E={e1,e2,…,em},ei=<wp,wq>,wp,wq∈W,其中,i=1,2,3,…n;对每条边ei的存在,当且仅当wq是wp的k近邻,ei的方向为wp指向wq。这些边和点构成了k近邻有向图。S104,根据k近邻有向图构造k-聚类图,并对k-聚类图中的聚类簇进行标记。可选地,在本专利技术实施例中,根据k近邻有向图中的k-互邻居关系构造k-聚类图。有向图中的k-互邻居关系是指:对于有向图G,如果G中任意两点wp和wq,存在边epq=<wp,wq>和eqp=<wq,wp>,即wp是wq的k近邻本文档来自技高网...

【技术保护点】
1.一种嵌入式智能终端异常数据的检测方法,其特征在于,所述检测方法包括:接收待测数据,所述待测数据包含异常数据;确定所述待测数据中的对象,每个对象的k近邻,以及所述对象之间的k近邻关系;根据所述对象之间的k近邻关系构造k近邻有向图;根据所述k近邻有向图构造k‑聚类图,并对所述k‑聚类图中的聚类簇进行标记;当所述聚类簇中的部分聚类簇满足预设条件时,所述部分聚类簇中的待测数据作为异常数据输出。

【技术特征摘要】
1.一种嵌入式智能终端异常数据的检测方法,其特征在于,所述检测方法包括:接收待测数据,所述待测数据包含异常数据;确定所述待测数据中的对象,每个对象的k近邻,以及所述对象之间的k近邻关系;根据所述对象之间的k近邻关系构造k近邻有向图;根据所述k近邻有向图构造k-聚类图,并对所述k-聚类图中的聚类簇进行标记;当所述聚类簇中的部分聚类簇满足预设条件时,所述部分聚类簇中的待测数据作为异常数据输出。2.根据权利要求1所述的检测方法,其特征在于,在所述对所述k-聚类图中的聚类簇进行标记之后;所述检测方法还包括:当所述聚类簇中的部分聚类簇满足预设条件时,向云端服务器发送请求消息,所述请求消息用于所述云端服务器对所述部分聚类簇中的待测数据进行计算,获得异常数据并输出。3.根据权利要求2所述的检测方法,其特征在于,所述云端服务器对所述部分聚类簇中的待测数据进行计算,获得异常数据并输出,包括:所述云端服务器计算所述部分聚类簇中的所述待测数据基于簇的离群点因子;当所述部分聚类簇中的所述待测数据基于簇的离群点因子满足预设阈值时,确定所述部分聚类簇中所述待测数据作为异常数据输出。4.根据权利要求1至3任一项所述的检测方法,其特征在于,所述根据所述k近邻有向图构造k-聚类图,包括:根据所述k近邻有向图中的k-互邻居关系构造k-聚类图。5.一种嵌入式智能终端,其特征在于,所述嵌入式智能终端包括存储...

【专利技术属性】
技术研发人员:胡琳琳耿筱林郭志川
申请(专利权)人:中国科学院声学研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1