一种智能网联汽车流量的识别方法及装置制造方法及图纸

技术编号:35932297 阅读:14 留言:0更新日期:2022-12-14 10:18
一种智能网联汽车流量的识别方法及装置涉及信息技术领域,本发明专利技术包括计算流量度量模型步骤和用流量度量模型计算流量类型步骤;本方法在结合使用网络流量类特征和设备信息类特征的识别方式进基础上,增加了使用一种基于流量切片和机器学习分类技术的方法,用来实现剔除混杂在车联网流量中的非联网汽车流量,在降低联网汽车流量识别漏报率的同时,极大地提升了流量识别的准确性。升了流量识别的准确性。升了流量识别的准确性。

【技术实现步骤摘要】
一种智能网联汽车流量的识别方法及装置


[0001]本专利技术涉及信息


技术介绍

[0002]根据中国汽车工程协会发布的《中国智能网联汽车产业发展报告(2021)》的数据, 2021年,我国乘用车新车市场中具备L2级智能驾驶功能的车型销售476.6万辆,渗透率达到23.5%。智能网联汽车技术支持车辆接入互联网,可以通过互联网获取数据和服务,由于通信通过公共网络进行传输,车联网容易受到不同类型的网络攻击,比如拒绝服务、欺骗和网络嗅探等。而目前车辆厂商安全措施未能及时跟上,除了在车辆终端或车联网服务端上进行安全防护手段的加强,在移动网管道侧对车联网网络安全进行实时监控,及时了解车联网网络的动态也必不可少。
[0003]在通过移动管道侧对联网汽车进行安全监管的领域中,目前针对智能网联汽车的流量识别技术主要是使用基于特征指纹库的识别方法。比如专利技术专利号【CN112367326A】通过分析已知的车联网应用数据的网络特征,形成车联网流量模板,之后再将未知的流量数据与与该车联网流量模板进行匹配,来识别流量是否是车联网流量,该方法本质上是一种基于特征指纹的识别方法,具有准确率高的特点,但其完全依赖于网络流量类特征指纹数据库,泛化性降低,随着新增的车联网应用数据的不断出现,需要不断更新库,因此无法及时识别新增的车联网应用流量数据,存在较高的漏报率;专利专利技术号【CN107948172A】中,通过结合使用使用APN接入点名称、号段、车联网应用中的一种或多种特征,对移动网流量进行筛选,以获取与车联网通信相关的流量,该方法除了使用车联网网络流量特征之外,还结合使用APN特征和号段特征,这两类特征具有较强的泛化性,可以有效降低车联网流量识别的漏报率,但实际情况中存在非联网汽车类设备接入到车载无线网络的情况,这种方法下使用该方法无法有效区分出混杂车联网流量中的非车联网设备产生的流量,因而存在识别准确率不足的问题。
[0004]一种智能网联汽车流量的识别方法及装置提出了一种在移动网流量中精确识别联网汽车流量的方法,首先通过结合使用网络流量类特征和设备信息类特征的方式,可有效降低识别漏报率,达到识别车联网流量更全面的效果,之后采用流量切片的方式对流量进行细分并提取特征,再结合使用机器学习的方法,过滤掉混杂在车联网流量中的非联网汽车流量,提升流量识别的准确性和精确度。一种智能网联汽车流量的识别方法及装置,可以全面且精准地识别出移动网流量中的联网汽车流量,为后续的车联网网络态势监管和网络安全监测提供有力的数据支撑。
[0005]用到的现有技术说明APN (Access Point Name,即“接入点名称”):APN是GPRS等移动网络和另一个计算机网络之间的网关的名称,用以定义移动设备上所有移动数据连线的网络路径。移动设备必须设置了运营商提供的接入点名称才能创建数据连接。运营商会使用这个名称区别将要创建的网络连接的类型。接入点名称由两部分组成,包括网络标识符和运营商标识符,比
如ctnet.mnc011.mcc460.gprs,在物联网场景或车联网场景中,通常会使用特定的网络标识符,用以表示APN用于某个特定场景,因此,可以通过对这类APN进行搜集和特征字符提取,通过识别其中的专用车联网场景APN,来达到识别车联网终端的目的。
[0006]IMEI国际移动设备识别码:IMEI号,即通常所说的“串号”,用于在移动网络中识别每一部独立的移动通信设备,相当于移动设备的身份证。序列号共有15位数字,前6位TAC是型号核准号码,代表设备类型。接着2位FAC是最后装配号,代表产地。通过IMEI的前8位数据可确定移动设备类型,根据这一特性,我们可以建立IMEI前8位数据对应设备类型的特征库,并可通过对该信息准确地识别出移动网流量中的车联网设备。
[0007]MSISDN号码相当于固定网的用户电话号码,是供用户拨打的公开号码。由于GSM系统中移动用户的电话号码结构是基于ISDN的编号方式,所以称为MSISDN,即为移动用户的国际ISDN号码。
[0008]号段。不同运营商的SIM卡号段不同,为了连接到各类智能硬件,针对物联网场景和车联网场景也有专门的号段,专用于物联网场景。因此,可以使用MSISDN号码的号段信息,区分是否属于车联网流量。
[0009]协议类型。车联网场景下有专用的车联网协议,比如我国的车联网协议主要有JT/T808、JT/T905、GB/T32960等协议, JT/T808是由交通运输部制订的标准协议,规定了道路运输车辆卫星定位系统北斗兼容车载终端与监管/监控平台之间的通讯协议与数据格式,通过在流量日志数据中识别这些类型的协议,可有效区分出车联网流量数据。
[0010]目的IP。部分车联网TSP平台服务端使用了固定IP地址,通过分析得到这些IP地址信息后,可以在移动流量中筛选出连接该目的IP的流量,视作车联网流量。联网生态圈整体可分为TSP平台、整车厂商、应用/内容服务提供商、电信运营商、车辆零部件厂商、芯片厂商、汽车后向服务商、传统线下厂商、交管局等。TSP是汽车远程服务提供商。在Telematics产业链居于核心地位,上接汽车、车载设备制造商、网络运营商,下接内容提供商。
[0011]域名。某个型号的联网汽车通常会访问同样的车联网服务端,可以将该服务地址中的域名作为车联网流量访问特征。
[0012]URL地址。某个型号的联网汽车通常会访问满足模式或特征的URL,可将该URL地址的模式作为特征。
[0013]LAC位置区识别码。它是唯一地识别我国数字PLMN中每个位置区的,是一个2字节16进制的BCD码。
[0014]CELL ID是网络中小区的编号。
[0015]IMSI一般指国际移动用户识别码。
[0016]IP指网际互连协议地址。
[0017]http user

agent是用来检查浏览页面的访问者在用什么操作系统。
[0018]http content

type 对照表, content

type内容类型,一般是指网页中存在的content

type,用于定义网络文件的类型和网页的编码,决定浏览器将以什么形式和什么编码读取这个文件。
[0019]URL一般指统一资源定位系统。统一资源定位系统是因特网的万维网服务程序上用于指定信息位置的表示方法。
[0020]域名,又称网域,是由一串用点分隔的名字组成的Internet上某一台计算机或计
算机组的名称,用于在数据传输时对计算机的定位标识。
[0021]XGBOOST又叫极度梯度提升树,是boosting算法的一种实现方式,可以有效处理分类问题。XGBOOST模型的训练过程大致为:由于XGBOOST由多棵决策树组成,因此需要经过多轮训练,每轮训练生成一个新的树模型。在每轮训练生成新树的过程中,最基本的操作是节点分裂,也就是要找到该节点的最优特征和最优切分点,将该叶子节点按照最本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能网联汽车流量的识别方法,其特征在于包括计算流量度量模型步骤和用流量度量模型计算流量类型步骤; 1)计算流量度量模型步骤

通过抓包工具获取移动网的上网流量数据;

通过流量解析器进行流量解析后得到流量解析日志,流量解析日志获取的网络流量数据参数,包括:MSISDN号码、LAC、CELL ID、IMSI、IMEI、APN、IP、开始时间、结束时间、持续时间、源IP、源端口、目的IP、目的端口、协议类型、上行流量大小、下行流量大小、上行包数、下行包数、总流量、返回状态码、http user

agent、http content

type、域名、URL;

由流量筛选器查询IMEI数据库,根据IMEI数据库记录的车联网设备类型,提取保留相关车联网设备的网络流量;由流量筛选器根据MSISDN号码的号段信息,提取保留属于物联网号段的网络流量;由流量筛选器提取保存符合车联网协议的网络流量,车联网网络协议包括JT/T808、JT/T905、GB/T32960;由流量筛选器根据车联网TSP平台服务端IP地址表,提取保留目的IP属于车联网TSP平台服务端IP地址表中地址的网络流量为车联网流量;由流量筛选器根据车联网服务端域名表,提取保留访问域名属于车联网服务端域名表的网络流量为车联网流量;由流量筛选器根据车联网服务URL表,提取保留访问URL属于车联网服务URL表的网络流量为车联网流量;流量筛选器将提取保留的所有网络流量发送给流量切片器;
⑷ꢀ
流量切片器接收的网络流量包括了所有车联网流量和通过车载移动联网设备连接互联网的设备所产生的非车联网流量,将流量切片器接收的网络流量进行切片以进一步筛选车联网流量;切片的方法是以网络流量中的IMEI作为设备标识加上源IP和源端口生成切片标识,以切片标识为依据将网络流量切成多个流量块;流量切片器将流量块发送给特征提取器;

特征提取器提取切分后的流量块的网络特征,网络特征包括:每分钟上行访问次数、每分钟下行访问次数、每分钟上行流量大小、每分钟下行流量大小、每分钟访问目的IP去重后数量、每分钟访问不同目的IP访问次数分布的前五名的占比;

由流量分类器根据特征提取器提取的流量块特征对流量块进行车联网流量和非车联网流量分类;当每分钟上行流量大小和每分钟下行流量大小的流量变化率在百分之10及以内时将对应的流量块标记为车联网流量,当每分钟上行流量大小和每分钟下行流量大小的流量变化率超过百分之10时将对应的流量块标记为非车联网流量;当每分钟上行访问次数和每分钟下行访问次数的访问次数变化率在百分之10及以内时将对应的流量块标记为车联网流量,当每分钟上行访问次数和每分钟下行访问次数的访问次数变化率超过百分之10时将对应的流量块标记为非车联网流量;当每分钟访问目的IP去重后数量小于等于2时将对应的流量块标记为车联网流量,当每分钟访问目的IP去重后数量大于3时将对应的流量块标记为非车联网流量;当每分钟访问不同IP访问次数分布前五名占比中后第四名和第五名位置为零时将对应的流量块标记为车联网流量,当每分钟访问不同IP访问次数分布前五名占比中后第四名和第五名位置数值大于零时将对应的流量块标记为非车联网流量;流量分类器收集100条车联网流量和100条...

【专利技术属性】
技术研发人员:林飞王丹程红易永波古元毛华阳华仲峰
申请(专利权)人:北京亚鸿世纪科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1