【技术实现步骤摘要】
一种基于真实物理含义的CAN
‑
FD异常检测方法
[0001]本专利技术属于汽车自动驾驶
,尤其涉及一种基于真实物理含义的
CAN
‑
FD
异常检测方法
。
技术介绍
[0002]随着汽车电子技术的快速发展,汽车的智能化和自动化水平不断提升
。
车载网络承担着车辆内部子系统与外部环境之间的通信任务,对于车辆的数据交换和智能决策至关重要
。CAN
总线作为车载网络的核心,允许车辆中的不同电子控制单元之间进行实时通信,使得各个系统可以相互发送和接收数据,从而实现车辆内部信息的交换和共享
。
随着汽车电子系统复杂程度不断增加,传统的
CAN
总线协议在带宽和传输速率上面临限制,在
CAN
的基础上发展出了
CAN
‑
FD。CAN
‑
FD
通过扩展数据字段提高了传输速率,这使得
CAN
‑
FD
更加适用于 ...
【技术保护点】
【技术特征摘要】
1.
一种基于真实物理含义的
CAN
‑
FD
异常检测方法,其特征在于,包括以下步骤:步骤
1、
基于真实物理含义的时序特征提取:首先在真实汽车上采集无攻击的原始
CAN
‑
FD
数据集,将原始数据集中的数据划分为训练集与测试集;进而通过调整窗口滑动步长与打乱序列顺序的方法对训练集进行数据增强处理,在测试集中插入攻击报文模拟
DoS、
模糊
、
重放与欺骗攻击生成攻击数据集;根据不同的
CAN
‑
FD ID
的物理含义划分规则提取报文数据字段的真实物理含义,对每个
CAN
‑
FD ID
的物理含义特征进行预处理,以保持数据集完整性;同时基于数据种类数量对不同
CAN
‑
FD ID
特征进行重新排序与组合,增强模型对于重要特征的识别,对各个输入特征分别进行独热编码和最小
‑
最大缩放处理;步骤
2、
基于结合自注意力机制的长短时记忆网络的异常检测:首先搭建结合自注意力机制的长短时记忆网络模型;根据设定的滑动窗口与输出序列大小得到训练集输入特征与期望输出以及攻击数据集的输入特征与实际输出,利用训练集的输入特征与期望输出完成对结合自注意力的长短时记忆网络模型的训练;利用攻击数据集的输入特征与实际输出对训练好的异常检测模型进行验证,以真正例
、
假正例
、
真负例
、
假负例
、
准确度
、
精准度
、
召回率和
F1
值对模型性能进行评价
。2.
根据权利要求1所述的基于真实物理含义的
CAN
‑
FD
异常检测方法,其特征在于,所述步骤1包括以下具体步骤:步骤
1.1、
数据采集与划分:将采集到的原始
CAN
‑
FD
数据集中的数据划分为训练集剩下数据归为测试集
m
代表了一帧报文实例,
m
s
与
m
t
分别代表训练集与测试集中的报文实例;
n
origin
为原始数据集中的报文总数,
n
s
与
n
t
分别为训练集与测试集中的报文总数;训练集作为训练集数据增强的输入,测试集作为攻击数据集生成的输入;步骤
1.2、
训练集数据增强:通过调整窗口滑动步长与打乱序列顺序的方法对训练集进行数据增强;令训练集输入报文序列的滑动窗口的大小为
u
,滑动步长为
z
,输出报文序列的大小为
v
,则有:,则有:,则有:其中与分别是与相互对应输入序列与输出序列,
ceil
为向上取整函数,它们满足:为向上取整函数,它们满足:通过使用不同的步长
z
i
来控制窗口的滑动间隔,其中
i∈[1
,2,
...
,
N
step
]
,
N
step
为总步长,从而在原始数据上创建更多的输入序列和目标输出序列
同时,通过对输入序列和目标输出序列的顺序进行打乱,
N
shuffle
为打乱总次数,第
i
次得到打乱的输入报文序列与输出报文序列表示如下,其中
i∈[1
,2,
...
,
N
shuffle
]
:函数
f
shuffle
按照随机并且相同的顺序打乱按照随机并且相同的顺序打乱以保证与之间的元素保持一一对应的关系,将上述生成的数据进行拼接以得到完成数据增强后的输入序列与输出序列与输出序列与输出序列步骤
1.3、
攻击数据集生成:所需的初始化参数包括测试集选取的总的数据段数
N
attack
、
各数据段中包含的报文数
n
attack
、
插入的数据帧数范围以及攻击报文
m
attack
;为确定攻击报文的插入位置,算法最初从训练集中随机选取互不重叠的数据段之后在这些数据段的每一帧报文后随机插入
k
attack
帧攻击报文
m
attack
,
k
attack
为间的随机数,即可得到攻击数据集并规定:在模拟
DoS
攻击时,
m
attack
为
ID
字段为
0x00
且数据字段全为零的报文;进行模糊攻击时,
m
attack
为
CAN ID
为0×
000
到0×
7FF
之间的随机数且数据字段随机的报文;重放攻击中的
m
attack
与其插入位置的前一帧报文相同;欺骗攻击报文的生成需选取测试集中特定
CAN ID
的报文,选定该类报文中的一个物理特征
x
,令
x
在报文中的起始位为
b
start
,终止位为
b
end
;在
m
attac
k
的插入位置前,寻找距离最近的相同
ID
的正常报文
m
Ben
,更改
m
Ben
的范围内的数据,为了使得生成的攻击报文真实地模拟攻击者进行欺骗攻击时的场景,使得更改后的特征值
x
Spo
与原来的正常特征值
x
Ben
存在差异,故规定:步骤
1.4、
数据预处理:所需的初始化参数包括训练集不同
ID
报文的真实物理含义特征提取规则库填充特征
f
fill
以及最大真实物理含义特征数
n
max
;根据对应的
ID
与提取规则对训练集中每一帧报文提取其真实物理含义特征
F
,保持数据集的完整性,若提取出的特征数小于
n
max
,则利用
f
fill
将
F
的特征数补充至
n
max
;根据每个
ID
的各个特征的数据种
类数对提取出的特征进行降序重排,同时对重排后的特征进行归一化;最后,对数值不变的特征进行特征值合并;为了对特征进行归一化,对其进行了最小
‑
最大缩放,即对每类特征
X
,计算其最小值
X
min
和最大值
X
max
,通过以下公式将
X
中的特征值
x
映射为
x
nor
:所使用的特征包括各个报文的
ID
以及其真实物理含义特征,并且对变量类型数不超过
n
encode
的特征进行了独热编码;同时,对于变量类型数超过
n
encode
的特征,保留了其物理数值关系以增强模型对其真实物理含义特征的理解;对于中没有对应
ID
的提取规则的报文,其特征将用
f
fill
=
‑1填充;对测试集进行特征重排时,各个
ID
的特征重排的顺序以及归一化时,各类特征
X
的最小值
X
min
和最大值
X
max
与训练集保持一致
。3.
根据权利要求2所述的基于真实物理含义的
CAN
‑
FD
异常检测方法,其特征在于,所述步骤2包括以下具体步骤:步骤
2.1、
网络模型搭建...
【专利技术属性】
技术研发人员:赵睿,樊宇泽,罗橙,刘英奇,高菲,高镇海,李泷漪,
申请(专利权)人:吉林大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。