一种利用辅助数据集和格拉姆矩阵的汽车异类检测方案制造技术

技术编号:38261147 阅读:12 留言:0更新日期:2023-07-27 10:21
本发明专利技术公开了一种利用辅助数据集和格拉姆矩阵的汽车异类检测方案,该方案包括以下几个步骤:建立汽车训练数据集、非汽车辅助训练数据集和测试数据集;预处理数据并构建卷积神经网络,在训练数据集和辅助数据集上进行预训练;计算网络各层的Gram矩阵,作为该层单类支持向量机(OSVM)的输入,并根据各层OSVM的正确率,选择其中最高的作为整个系统的异类检测分类器。这种方案提高了卷积神经网络对汽车异类检测的精度,同时增强了系统的鲁棒性和泛化能力。力。力。

【技术实现步骤摘要】
一种利用辅助数据集和格拉姆矩阵的汽车异类检测方案


[0001]本专利技术属于网络图像分类领域和分布外数据(Out

of

Distribution,OOD)异类检测领域。特别涉及针对提高系统对汽车异类检测的正确率的需求,设计了一种利用辅助数据集和格拉姆矩阵的汽车异类检测方案。

技术介绍

[0002]逐渐成熟神经网络技术已渗透到人们生活各处,包括语音处理、目标检测、目标分类等多个领域。特别是在交通系统中,神经网络已成为了针对汽车进行检测的重要手段和先进工具。但是在实际应用过程中,由于交通路况的复杂性,系统往往会受到其他不确定因素的干扰。因此,系统是否能够有效检测出数据集中非汽车的异类样本已然成为一个重要课题。
[0003]现有的一些传统检测方法,就是在训练网络的阶段,扩大所用到的非异常数据集和异常数据集。但是,由于在项目的实际应用中,异常数据的分布是不可知的,所以在这个方法中,要用到的异常数据训练集会非常庞大,同时,网络的架构也会十分的庞大,这会让整个网络的训练过程变得非常复杂繁琐,且计算量非常巨大。
[0004]此外,已有学多学者通过其他方法进行OOD数据的检测。例如在2017年,由Hendrycks和Gimpel等人在论文《Abaselinefordetectingmisclassifiedandout

of

distributionexamplesinneuralnetworks》提出的一个检测异类数据的基准方法Baseline。他们对网络的softmax层设定了一个阈值,通过改阈值来输入数据进行检测,判断是否为异常数据。
[0005]在这之后,很多学者都在此方法上做出优化,进行改进。但无论如何,这类方法主要是利用网络倒数第二层的特征输出来进行异常数据的检测。2019年,Abdelzad等人在文章《whyrelunetworksyieldhigh

confidencepre

dictionsfarawayfromthetrainingdataandhowtomitigatetheproblem》中提到,网络倒数第二层经过训练后,主要提取的是作用于非异类样本分类任务的特征。但是当输入异类样本的时候,仅利用该层提取的特征并不能有效将非异类样本和异类样本区分开来。其他学者,如Hein、Andriushchenko和Bitterwolf等人也提到过,基于softmax层的检测方法在最后结果输出的时候,会不可避免地为异类样本分配很高的置信度。这几乎是网络普遍存在的一个问题。

技术实现思路

[0006]为了解决现存技术存在的一些问题,本专利技术的目的是提供一种利用辅助数据集和格拉姆矩阵的汽车异类检测方案。首先利用训练数据集和辅助训练数据集对网络进行预训练,提升网络对异类样本的鉴别能力,然后利用每层的Gram矩阵训练对应的OSVM,并筛选出精确度最高的OSVM作为异类检测分类器。该方法优于传统方法异类检测的效果。
[0007]本专利技术的方案所采用的技术方案是:一种利用辅助数据集和格拉姆矩阵的汽车异类检测方案。
[0008]一种利用辅助数据集和格拉姆矩阵的汽车异类检测方案,其特征在于,包括以下步骤:
[0009]步骤1:准备数据集;
[0010]步骤2:利用训练数据集和辅助数据集预训练网络;
[0011]步骤3:计算各层Gram矩阵和训练对应的OSVM;
[0012]步骤4:筛选出最优OSVM;
[0013]步骤5:对测试数据进行异类检测。
[0014]作为优选,步骤1的具体实现包括以下子步骤:
[0015]步骤1.1:数据集包括用于训练网络的汽车数据集D
in
,用于辅助训练的非汽车数据集以及用于测试的其他数据集D
out
,三个数据集互不相交;
[0016]步骤1.2:对上述训练数据集进行预处理,包括对图像进行一系列变换和加干扰进一步扩大数据集。
[0017]作为优选,步骤2的具体实现包括以下子步骤:
[0018]步骤2.1:建立网络,所建立的网络包含多个卷积层和至少一个全连接层;
[0019]步骤2.2:将训练数据集D
in
和辅助数据集一同输入至网络进行预训练,其中,训练数据集具有C个类别,在训练过程中,训练样本最大输出概率会趋向于预设置的训练正确率Atr,而辅助样本的每一分类概率趋向于1/C;
[0020]步骤2.3:将网络迭代多次训练,直至其对训练数据集的分类正确率达到一个较高且稳定的值。
[0021]作为优选,步骤3的具体实现包括以下子步骤:
[0022]步骤3.1:计算网络每一层的Gram矩阵;
[0023]步骤3.2:训练对应的OSVM。
[0024]作为优选,步骤4的具体实现包括以下子步骤:
[0025]步骤4.1:将数据集D
in
和数据集输入至系统,计算当前输入样本D所在网络层l中Gram矩阵,并计算出对应的OSVM的正确率;
[0026]步骤4.2:比较各层OSVM的正确率,选择最优的作为系统的异类检测分类器;
[0027]作为优选,步骤5的具体实现包括以下子步骤:
[0028]步骤5.1:将测试数据集D
out
输入至系统,利用上述筛选出的OSVM对当前测试数据进行异类检测。
[0029]本专利技术方法与现有的技术相比有如下的优点和有益效果:
[0030]首先,本专利技术方法并不需要提前真实的异类数据,这保证了系统在训练阶段不需要大量的数据进行训练以及所构建的网络结构规模并不会十分巨大,这大大减小了系统的运算量;其次,网络在训练过程中运用到了一个辅助训练的数据集,这使得网络对异类样本会更加敏感,更加容易识别异类样本。最后,利用了Gram矩阵提取网络中各层次的特征,这使得系统更能有效检测异常数据。因此,本专利技术相比于传统方法,异类检测的效果会更好。
附图说明
[0031]图1:本专利技术实施例的应用场景示例图。
[0032]图2:本专利技术实施例的方法流程图。
[0033]图3:本专利技术实施例中使用的BIT数据集样本示意图。
[0034]图4:本专利技术实施例中使用的GTSRB数据集样本示意图。
[0035]图5:本专利技术实施例中使用的CatsvsDogs数据集样本示意图。
[0036]图6:本专利技术实施例中使用的INRIA数据集样本示意图。
具体实施方式
[0037]为了便于本领域普通技术人员理解和实施本专利技术,下面结合附图及实施例对本专利技术作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本专利技术,并不用于限定本专利技术。
[0038]图1所示的是本专利技术一种利用辅助数据集和格拉姆矩阵的汽车异类检测方案的应用场景示例。
[0039]请见图2,本专利技术提供一种本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种利用辅助数据集和格拉姆矩阵的汽车异类检测系统,其特征在于:所述的系统用到的数据汽车训练数据集、非汽车辅助数据集、测试数据集;训练数据集和辅助数据集用于预训练网络;系统用到的网络通过训练后,计算各层Gram矩阵,并作为该层OSVM的输入;计算各层OSVM的正确率,并选择最高的作为系统的异类检测分类器;测试数据输入网络,由上述的OSVM进行异类数据的判断。2.一种利用权力要求1所述的了一种利用辅助数据集和格拉姆矩阵的汽车异类检测方案,其特征在于,包括以下几个步骤:步骤1:准备数据集;步骤2:利用训练数据集预训练网络;步骤3:计算各层Gram矩阵和训练对应的OSVM;步骤4:筛选出最优OSVM;步骤5:对测试数据进行异类检测。3.根据权利要求2所述的方法,其特征在于,步骤1的具体实现包括以下子步骤:步骤1.1:训练的汽车数据集与非汽车辅助数据集,该两个集合不相交;步骤1.2:对上述数据集进行预处理,包括对图像进行一系列变换和加干扰进一步扩大数据集。4.根据权利要求...

【专利技术属性】
技术研发人员:林威李玉鑑刘晴
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1