基于可疑集构建自训练SVM的开放世界图像来源取证方法技术

技术编号:41385246 阅读:21 留言:0更新日期:2024-05-20 19:06
基于可疑集构建自训练SVM的开放世界图像来源取证方法,属于计算机图像处理技术领域。技术方案:将图像分为训练集和测试集;分别从所示训练集和测试集中提取CFA特征;将上述二者的CFA特征投入SVDD分类器进行粗分类,分类为已知类和未知类;将未知类分为可疑集和若干未知类;将所述已知类、可疑集和若干未知类进行自训练SVM输出结果。有益效果:本发明专利技术在特征空间中的超曲面包络优化实现已知源和未知源粗分类,基于集成判别思想下的多种距离度量聚类融合以及基于直推学习思想构架迭代分配更新的自训练SVM分类器;解决了开放世界下图像来源取证问题;且能够适应不断更新的市面相机型号,有效利用和学习未知源信息用于强化分类器性能。

【技术实现步骤摘要】

本专利技术属于人工智能行业,涉及计算机图像处理,尤其涉及一种基于可疑集构建自训练svm的开放世界图像来源取证方法。


技术介绍

1、随着相机制造业的蓬勃发展,市面上的相机品牌和种类日新月异,取证分析人员很难实时掌握市面上的所有品牌型号的相机信息。在传统的封闭环境中,相机来源鉴别往往被认为是一个确定类别数的多分类问题。如果待鉴别图像来自于训练集外的(未知的)相机拍摄,传统封闭环境下的分类方法会把该图像错误地归类到已知的来源相机之一。而相对于传统的封闭环境,开放环境下的数字图像来源鉴别则允许待测试图像来自已知数据集合之外的未知类,通过“未知类”的引入大大减少了分类器的误分类问题,因此开放环境下的数字图像来源鉴别被认为是一个类别数不确定的多分类问题。

2、开放环境下图像来源取证的几个主要思路:

3、1.决策边界雕刻[1]:将已知模型的图像作为正类样本,将其他已知模型的图像作为负样本。然后,通过调整决策边界来最小化假阳性匹配,训练二值支持向量机来区分正样本和负样本。

4、2.k近邻算法[2]:以k近邻准则从测试集中抽取未知源图像并本文档来自技高网...

【技术保护点】

1.一种基于可疑集构建自训练SVM的开放世界图像来源取证方法,其特征在于,步骤如下:

2.如权利要求1所述的基于可疑集构建自训练SVM的开放世界图像来源取证方法,其特征在于,步骤S2中利用基于协方差矩阵估计CFA插值权值系数来提取图像样本特征,对于G颜色通道中某插值点(x,y),选取该点(2k+1)·(2k+1)的邻域,在三个通道上对该点进行插值可计算得该点像素值为:

3.如权利要求2所述的基于可疑集构建自训练SVM的开放世界图像来源取证方法,其特征在于,选择k=3,计算得插值点的邻域大小为2k+1=7;基于Bayer CFA结构来选择邻域内R、B采样点的G通道插...

【技术特征摘要】

1.一种基于可疑集构建自训练svm的开放世界图像来源取证方法,其特征在于,步骤如下:

2.如权利要求1所述的基于可疑集构建自训练svm的开放世界图像来源取证方法,其特征在于,步骤s2中利用基于协方差矩阵估计cfa插值权值系数来提取图像样本特征,对于g颜色通道中某插值点(x,y),选取该点(2k+1)·(2k+1)的邻域,在三个通道上对该点进行插值可计算得该点像素值为:

3.如权利要求2所述的基于可疑集构建自训练svm的开放世界图像来源取证方法,其特征在于,选择k=3,计算得插值点的邻域大小为2k+1=7;基于bayer cfa结构来选择邻域内r、b采样点的g通道插值系数以及两个g采样点的r、b插值系数进行估计,得插值系数总计((2k+1)2-1)×5=240个;对图像分别取多个不重叠的64×64大小的块状区域用来进行插值系数估计,求其方差和均值,因此得到共计240×2=480维的特征用于训练和测试。

4.如权利要求1所述的基于可疑集构建自训练svm的开放世界图像来源取证方法,其特征在于,步骤s3中,采用k-means聚类算法将原始类别相机模型聚类成k个子类;应用手肘法模型来为k-means算法确定最佳聚类数;手肘法核心指标是误差平方和,其表达式是:

5.如权利要求1所述的基于可疑集构建自训练svm的开放世界图像来源取证方法,其特征在于,步骤s4中,在得到未知类集合后,以若干种距离为聚类条件,结合集成判决思想在粗分类中得到的未知类集合中构建可疑集,并得到未知来...

【专利技术属性】
技术研发人员:王波郑伟明
申请(专利权)人:大连理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1