一种车联网异常终端识别方法及装置制造方法及图纸

技术编号:27597528 阅读:16 留言:0更新日期:2021-03-10 10:18
本说明书一个或多个实施例提供一种车联网异常终端识别方法及装置,其中,所述方法包括:采集车联网终端的原始数据;对所述原始数据进行聚类,获取多个数据群组以及不属于所述数据群组的第一异常数据点;针对每个数据群组,基于所述数据群组内的数据点的MSIN值大小及IMSI值出现次数获得第一疑似异常数据点;分别对每个数据群组进行聚类,获得第二疑似异常数据点;若某个数据点同时属于第一疑似异常数据点和第二疑似异常数据点,则该数据点为第二异常数据点;基于所述第一异常数据点和第二异常数据点,识别异常终端,有效的减少了误报、漏报的发生次数,提高了准确率。提高了准确率。提高了准确率。

【技术实现步骤摘要】
一种车联网异常终端识别方法及装置


[0001]本说明书一个或多个实施例涉及车联网数据处理
,尤其涉及一种车联网异常终端识别方法及装置。

技术介绍

[0002]随着车联网技术的发展,大量汽车信息被接入互联网,以通过互联网获取数据、服务等。与此同时,与之相关的网络安全问题也在不断浮现。作为保障车联网安全的重要一环,及时识别发现接入车联网网络的异常终端(指在身份信息等处与正常终端存在偏离的终端设备)十分重要。
[0003]现有技术中,通过对车联网终端的IP登录信息等进行检测,来识别该终端是否属于异常终端,该检测识别方式容易产生漏报、误报等,准确率低下。
[0004]IMSI(国际移动用户识别码,International Mobile Subscriber Identity)是区别移动用户的标志。其使用0~9的数字,总长度不超过15位。IMSI结构为MCC(Mobile Country Code)+MNC(Mobile Network Code)+MSIN(移动用户识别码,Mobile subscription identification number),其中MCC是移动用户所属国家代号,占3位数字,MNC是移动网号码,由两位或者三位数字组成,用于识别移动用户所归属的移动通信网,MSIN用以识别某一移动通信网中的移动用户。

技术实现思路

[0005]有鉴于此,本说明书一个或多个实施例的目的在于提出一种车联网异常终端识别方法及装置,以解决现有技术中车辆网异常终端检测识别准确率低下的问题
[0006]基于上述目的,本说明书一个或多个实施例提供了一种车联网异常终端识别方法,包括:
[0007]采集车联网终端的原始数据;
[0008]对所述原始数据进行聚类,获取多个数据群组以及不属于所述数据群组的第一异常数据点;
[0009]针对每个数据群组,基于所述数据群组内的数据点的MSIN值大小及IMSI值出现次数获得第一疑似异常数据点;
[0010]分别对每个数据群组进行聚类,获得第二疑似异常数据点;
[0011]若某个数据点同时属于第一疑似异常数据点和第二疑似异常数据点,则该数据点为第二异常数据点;
[0012]基于所述第一异常数据点和第二异常数据点,识别异常终端。
[0013]作为一种可选的实施方式,所述采集车联网终端的原始数据;对所述原始数据进行聚类,获取多个数据群组以及不属于所述数据群组的第一异常数据点,包括:
[0014]采集车联网终端的原始数据;
[0015]对所述原始数据进行预处理,获得待处理数据;
[0016]对所述待处理数据进行聚类,获取多个数据群组以及不属于所述数据群组的第一异常数据点。
[0017]作为一种可选的实施方式,所述对所述原始数据进行预处理,包括:
[0018]去掉所述原始数据中值为空的项;
[0019]将所述原始数据的IP地址转换为十进制;
[0020]将IP地址转换为十进制之后的所述原始数据转换为IP对应的IMSI值的格式。
[0021]作为一种可选的实施方式,所述对所述原始数据进行聚类,获取多个数据群组以及不属于所述数据群组的第一异常数据点,包括:
[0022]对所述待处理数据中的每个数据点,计算该数据点在预设范围内的局部密度;
[0023]将每个数据点的局部密度与预设的局部密度阈值进行比较,若某个数据点的局部密度大于局部密度阈值,且以该数据点为中心的预设范围内不存在局部密度大于该数据点的其他数据点,则将该数据点作为中心点,所述中心点与位于该中心点预设范围内的全部数据点共同形成一个数据群组;
[0024]不属于任何数据群组的数据点为第一异常数据点。
[0025]作为一种可选的实施方式,所述针对每个数据群组,基于所述数据群组内的数据点的MSIN值大小获得第一疑似异常数据点,包括:
[0026]针对每个数据群组,将该数据群组内的全部数据点按照MSIN值大小顺次排列;
[0027]计算相邻两个数据点之间的差值、及全部差值的平均值;
[0028]若某个数据点与相邻两个数量点之间的差值均大于平均值,则该数据点为第一疑似异常数据点。
[0029]作为一种可选的实施方式,所述针对每个数据群组,基于所述数据群组内的数据点的IMSI值出现次数获得第一疑似异常数据点,包括:
[0030]针对每个数据群组,计算每个IMSI值的出现次数,并确定IMSI值出现次数的中位数;
[0031]若某个数据点的IMSI值的出现次数低于中位数,则该数据点为第一疑似异常数据点。
[0032]作为一种可选的实施方式,所述分别对每个数据群组进行聚类,获得第二疑似异常数据点,包括:
[0033]针对每个数据群组,从数据群组中任选一个数据点,判断该数据点是否为核心点,若不是核心点,则将该数据点标记为第二疑似异常数据点;若是核心点,则将该数据点以及与该数据点的距离小于预设半径的其他数据点形成一个簇;
[0034]判断该簇内的数据点是否为核心点,若是核心点,则将与该核心点的距离小于预设半径的簇外的其他数据点纳入该簇,并返回执行判断该簇内的数据点是否为核心点的步骤,直至该簇无法纳入新的数据点;
[0035]从簇外的数据点任选一个数据点,返回执行判断该数据点是否为核心点的步骤,直至数据群组内的全部数据点标记完毕。
[0036]作为一种可选的实施方式,所述从数据群组中任选一个数据点,判断该数据点是否为核心点,包括:
[0037]从数据群组中任选一个数据点;
[0038]以该数据点为圆心,判断距该数据点预设半径内的其他数据点的数量是否大于预设样本数;
[0039]若大于预设样本数,则该数据点为核心点;若小于预设样本数,则该数据点不是核心点。
[0040]作为一种可选的实施方式,所述判断该簇内的数据点是否为核心点,若是核心点,则将与该核心点的距离小于预设半径的簇外的其他数据点纳入该簇,包括:
[0041]从该簇内的数据点中任选一个数据点;
[0042]以该数据点为圆心,判断距该数据点预设半径内的其他数据点的数量是否大于预设样本数;
[0043]若大于预设样本数,则该数据点为核心点,判断是否有簇外的其他数据点距该核心点的距离小于预设半径,若有,则将与该核心点的距离小于预设半径的簇外的其他数据点纳入该簇;若小于预设样本数,则该数据点不是核心点。
[0044]与所述车联网异常终端识别方法相对应的,本专利技术实施例还提供了一种车联网异常终端识别装置,包括:
[0045]采集单元,用于采集车联网终端的原始数据;
[0046]第一聚类单元,用于对所述原始数据进行聚类,获取多个数据群组以及不属于所述数据群组的第一异常数据点;
[0047]获得单元,用于针对每个数据群组,基于所述数据群组内的数据点的MSIN值大小及IMSI值出现次数获得第一疑本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种车联网异常终端识别方法,其特征在于,包括:采集车联网终端的原始数据;对所述原始数据进行聚类,获取多个数据群组以及不属于所述数据群组的第一异常数据点;针对每个数据群组,基于所述数据群组内的数据点的MSIN值大小及IMSI值出现次数获得第一疑似异常数据点;分别对每个数据群组进行聚类,获得第二疑似异常数据点;若某个数据点同时属于第一疑似异常数据点和第二疑似异常数据点,则该数据点为第二异常数据点;基于所述第一异常数据点和第二异常数据点,识别异常终端。2.根据权利要求1所述的车联网异常终端识别方法,其特征在于,所述采集车联网终端的原始数据;对所述原始数据进行聚类,获取多个数据群组以及不属于所述数据群组的第一异常数据点,包括:采集车联网终端的原始数据;对所述原始数据进行预处理,获得待处理数据;对所述待处理数据进行聚类,获取多个数据群组以及不属于所述数据群组的第一异常数据点。3.根据权利要求2所述的车联网异常终端识别方法,其特征在于,所述对所述原始数据进行预处理,包括:去掉所述原始数据中值为空的项;将所述原始数据的IP地址转换为十进制;将IP地址转换为十进制之后的所述原始数据转换为IP对应的IMSI值的格式。4.根据权利要求3所述的车联网异常终端识别方法,其特征在于,所述对所述原始数据进行聚类,获取多个数据群组以及不属于所述数据群组的第一异常数据点,包括:对所述待处理数据中的每个数据点,计算该数据点在预设范围内的局部密度;将每个数据点的局部密度与预设的局部密度阈值进行比较,若某个数据点的局部密度大于局部密度阈值,且以该数据点为中心的预设范围内不存在局部密度大于该数据点的其他数据点,则将该数据点作为中心点,所述中心点与位于该中心点预设范围内的全部数据点共同形成一个数据群组;不属于任何数据群组的数据点为第一异常数据点。5.根据权利要求1所述的车联网异常终端识别方法,其特征在于,所述针对每个数据群组,基于所述数据群组内的数据点的MSIN值大小获得第一疑似异常数据点,包括:针对每个数据群组,将该数据群组内的全部数据点按照MSIN值大小顺次排列;计算相邻两个数据点之间的差值、及全部差值的平均值;若某个数据点与相邻两个数量点之间的差值均大于平均值,则该数据点为第一疑似异常数据点。6.根据权利要求1所述的车联网异常终端识别方法,其特征在于,所述针对每个数据群组,基于所述数据群组内的数据点的IMSI值出现次数获得第一疑似异常数据点,包括:针对每个数据群组,计算每个IMSI值的出现次数...

【专利技术属性】
技术研发人员:李明春白天瑜
申请(专利权)人:北京软慧科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1