数字样本图像的复制防止制造技术

技术编号:38941933 阅读:15 留言:0更新日期:2023-09-25 09:40
提供了一种用于训练基于人工智能的神经网络的计算机实施的方法。至少一个安全文件的至少一个数字图像被提供作为基准。数字训练图像的集合被提供,其中这些数字训练图像与安全文件的数字图像相比有所变更。该数字训练图像的集合包括或由正类数字训练图像的第一子集组成,其具有变更的视觉影响使得无偏人类观察者将相应数字训练图像的仿制品视为表示安全文件或多个安全文件。该数字训练图像的集合包括或由负类数字训练图像的第二子集组成。基准真值被提供给神经网络,至于相应数字训练图像是否被视为表示安全文件或多个安全文件。是否被视为表示安全文件或多个安全文件。是否被视为表示安全文件或多个安全文件。

【技术实现步骤摘要】
【国外来华专利技术】数字样本图像的复制防止


[0001]本专利技术涉及一种用于训练基于人工智能的神经网络的计算机实施的方法,该神经网络适用于在不认证安全特征的情况下将数字图像分类为是否被视为安全文件,一种用于至少一个安全文件的复制防止的计算机实施的方法,一种钞票检测器以及一种计算机程序产品。

技术介绍

[0002]与安全有关的文件诸如机票或钞票时常经受仿制行为,例如伪造行为。处理伪造文件的一项措施涉及评估可疑文件的真实性。然而,这种方法是一种下游活动,从某种意义上说,在对可疑文件执行认证过程时,原始文件已经被仿制。因此,与认证相关的措施不太可取。
[0003]原始文件的仿制品(reproduction)可以借助于扫描设备、打印机和/或复印设备来执行。仿制品也可以被视为诸如数据转换的数据复制过程。在这方面,假如文件在被仿制时有可能被视为原始安全文件,则避免仿制行为本身是有利的。在这种情况下,仿制品甚至在被执行前就避免了。在安全文件中包括的专门安全特征的方面,存在这样的方法。这就意味着,对于讨论中的给定文件,评估该文件是否包括最初包含在安全文件内的安全特征。然而,出于以下几个原因,这些方法是不利的。第一,在安全特征方面的评估是复杂的,并且要求精密的设备。第二,这样的评估过程将需要包含有关安全特征的特定信息。如果伪造者揭示评估过程,他们将获得该信息。第三,伪造者可能攻击安全特征以及讨论中的文件内所包括的修改后特征,这可能会导致评估方法的结果不正确。
[0004]为了防止上面所描述的行为的目的,存在各种安全特征。它们可以是例如由上述设备中的特殊检测器识别的印刷的图形设计元素。检测器然后可以触发响应,其干扰了所期行为,诸如拒绝处理或打印高度降质的图像。这样的图形元素可以被设计以便具有作为安全文件原图(artwork)的一部分的外观。这种元素的使用的示例可以在美国专利5,845,008中找到。在其他情况下,明显几乎不可察觉的特殊信号可以被添加到印刷设计中,使得它们由前述设备中的特殊检测器识别,其然后可以触发如上面所描述的响应。这种元素的使用的示例可以在美国专利6,449,377中找到。
[0005]然而,这些安全特征患有固有的漏洞。图形设计元素,即使试图使其看起来像原图的一部分,也可能经常出于其预期的安全目的而被技术人员轻易地识别。结果是,它们可以被稍微变更,以至于特殊检测器不再识别它们,从而无法中断仿制者的所期行为。这些元素也可能被滥用,通过将所述元素应用于不打算由合法用户保护的其他文件,使得人员不能完成对所述文件的扫描、复制或打印行为。
[0006]特殊信号诸如数字水印还可能具有使印刷文件失真的不理想特性。在钞票原图的情况下,这可能是尤其不可取的。失真(distortion)可以被减轻,尽管以牺牲信号强度为代价;通常要寻求一种妥协。
[0007]与机器学习结合的人工智能正越来越多地用于类似面部识别和其他物体识别的
应用。在这样的应用中,存在无限多的潜在图像,其可能需要被鲁棒地识别。例如经训练以识别灰松鼠图像的应用本身可能碰到灰松鼠大小、姿势、年龄、毛色深浅、采光或任何其他许多个体特性的巨大差异中的任一个。设计为可靠地识别个人面部的应用将不得不面对相似的差异,这最起码增加了应用的计算复杂度和计算资源需求。
[0008]亟待解决的客观技术问题可以被视为在于提供一种用于训练基于人工智能的神经网络的方法,该神经网络适用于在没有认证安全特征的情况下将数字图像分类为是否被视为安全文件,以及一种用于利用如此训练的神经网络的安全文件的复制防止的方法,该方法与现有技术相比有所改进。
[0009]根据本专利技术,神经网络未经训练以认证数字图像,特别是安全文件的数字图像。此外,本专利技术用于安全文件的复制防止的方法没有替换任何认证过程。相反,本专利技术用于复制防止的方法通常可以表示附加措施,其可以被实施以便评估数字样本图像的仿制品是否可能被无偏人类观察者感知为是安全文件。
[0010]该问题是由独立权利要求的主题解决的。优选实施例在从属权利要求和以下描述内指示,其中的每一个都可以单独或组合表示本专利技术的各方面。在指示出的设备方面所描述的优点和优选实施例将被相应地转移到相应的方法,反之亦然。

技术实现思路

[0011]本专利技术使用经过创造性训练的基于人工智能的神经网络以便确定文件的数字图像是否可以被复制/仿制,从而不利用表示用于复制保护的代码的安全特征的存在。因此,应被复制防止的文件并不需要包括用于复制保护的代码以便特别防止仿制数字图像。根据本专利技术,要被复制保护的文件的设计不必因使用用于复制保护的附加代码而被失真,这也降低了伪造者识别了用于保护的代码的区域的风险。另外,文件上用于复制保护的代码的缺省降低了这样的风险,即此种用于复制防止的代码可能被黑客攻击,或者该代码可能非法使用在其他项目上以非法停止其仿制。本专利技术的用于使用经过创造性训练的基于人工智能的神经网络的复制保护的方法特别适用于安全文件(特别是钞票)的高通量排序和/或复制/仿制解决方案。它可以是在较短的时间尺度上可执行的,因为它可以比安全文件的常用认证方法(其要求对用于复制保护的特定代码进行认证)需要更少的时间以确定文件是否应被仿制。
[0012]根据第一方面,提供了一种用于训练基于人工智能的神经网络的计算机实施的方法。该神经网络适用于将数字图像分类为是否被视为安全文件(在下文中还用A表示以供参考)。这意味着,该方法可以被配置为训练网络,用于将数字图像分类为被视为安全文件A或者用于将数字图像分类使得其不被视为安全文件。基于人工智能的神经网络,特别是卷积网络作为深度学习模型的优点,主要来自于对排除了归一化和标准化的整个未处理图像的解释。然后,神经网络通常将信号转换成特征的集合,在此基础上进行分类。特征的集合由于模型的架构和训练过程而在模型之间有所不同,但是通常可以被解释为有关图像内容的浓缩信息。
[0013]该方法包括提供至少一个安全文件的至少一个数字图像A1作为基准。
[0014]该方法还包括提供数字训练图像的集合(在下文中还用B1表示以供参考)。基于数字训练图像,该神经网络可以在分类过程方面进行训练。该数字训练图像与安全文件的数
字图像相比有所改变。
[0015]数字训练图像的集合包括正类数字训练图像的第一子集(在下文中还用B1

1指示以供参考),其具有变更的视觉影响使得无偏人类观察者将相应数字训练图像的仿制品视为表示安全文件或多个安全文件。
[0016]数字训练图像的集合还包括负类数字训练图像的第二子集(在下文中还用B1

2指示),其具有变更的视觉影响使得无偏人类观察者不将相应数字训练图像的仿制品视为表示安全文件或多个安全文件。
[0017]该方法还包括向基于人工智能的神经网络提供用于每个数字训练图像的基准真值(ground truth)。该基准真值表示关于相应数字训练图像的仿制品要被视为表示还是不表示安全文件或多个安全文件的一个或多个无偏人类观察者的至少一个接受水平。换言之,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.用于训练基于人工智能的神经网络(150)的计算机实施的方法(100),所述神经网络(150)适用于在不认证安全特征的情况下将数字图像分类为是否被视为安全文件(110,A),所述方法(100)包括或由以下组成:a)提供至少一个安全文件(110,A)的至少一个数字图像(A1)作为基准,b)提供数字训练图像(120,B1)的集合,其中,所述数字训练图像(120,B1)与所述安全文件(110,A)的数字图像(A1)相比有所变更,所述数字训练图像(120,B1)的集合包括正类数字训练图像的第一子集(125,B1

1)或由其组成,其具有变更的视觉影响使得无偏人类观察者将相应数字训练图像(125,B1

1)的仿制品视为表示安全文件(110,A)或多个安全文件(110,A),所述数字训练图像(120,B1)的集合包括负类数字训练图像的第二子集(130,B1

2)或由其组成,其具有变更的视觉影响使得无偏人类观察者不将相应数字训练图像(130,B1

2)的仿制品视为表示安全文件(110,A)或多个安全文件(110,A),以及c)向所述基于人工智能的神经网络(150)提供用于步骤b)中每个数字训练图像(120,B1)的基准真值(140),其中,所述基准真值(140)表示一个或多个无偏人类观察者的、关于相应数字训练图像(120,B1)的仿制品要被视为表示还是不表示安全文件(110,A)或多个安全文件(110,A)的至少一个接受水平。2.根据权利要求1所述的方法(100),其中,步骤b)中至少一个变更后的数字训练图像(120,B1)被降质,其中,所述数字训练图像的降质基于:训练文件(B),其已经被化学或物理攻击过,或训练文件(B)的数字图像,其中所述数字图像已经被数字攻击过。3.根据前述权利要求中任一项所述的方法(100),其中,步骤b)中至少一个变更后的数字训练图像(120,B1)与所述安全文件(110,A)的数字图像(A1)在分辨率、清晰度、一般性外观、形状、颜色、颜色分布和纵横比中的至少一个方面不同。4.根据前述权利要求中任一项所述的方法(100),其中,步骤b)中至少一个变更后的数字训练图像(120,B1)与所述安全文件(110,A)的数字图像(A1)在透视角、底层照明、着色、褶皱或折痕中的至少一个方面不同。5.根据前述权利要求中任一项所述的方法(100),其中,所述安全文件(110,A)包括一个或多个图形设计特征,特别是肖像或建筑形象或自然图形图像,并且其中步骤b)中至少一个数字训练图像(120,B1)与所述安全文件(110,A)的数字图像(A1)的不同之处在于至少一个设计特征被不同的设计特征替代,特别是不同的肖像或不同的建筑形象或不同的自然图像。6.根据前述权利要求中任一项所述的方法(100),其中,所述基准真值(140)表示至少四个无偏人类观察者的接受水平,并且其中所述基准真值(140)包括至少五个不同的接受水平或由其组成。7.根据前述权利要求中任一项所述的方法(100),其中,所述安全文件(110,A)是钞票,其中在步骤a)中分别包括所述钞票的正面图像(A2)和反面图像(A3)的两个数字图像被提供,并且其中在步骤b)中每个正类数字训练图像(125,B1

1)具有变更的视觉影响使得无偏人类观察者将相应数字训练图像(125,B1

1)的仿制品视为表示安全文件(110,A)或多个安全文件(110,A)的正面图像(A2)和/或反面图像(A3)。
8.根据前述权利要求中任一项所述的方法(100),其中,所述方法使用具有一个或多个神经层的深度神经网络(150)来执行,特别地,其中每层独立于其他层表现出若干神经元和/或其中每层具有分支或非分支的架构结构。9.根据前述权利要求中任一项所述的方法(100),其中,所述基于人工智能的神经网络(150)包括机器学习能力。10.根据前述权利要求中任一项所述的方法(100),其中,所述方法(100)针对多个安全文件(110,A)的闭合集合被执行,其中所述基于人工智能的神经网络(150)针对所述安全文件(110,A)的闭合集合的每个安全文件(110,A)被训练。11.根据前述权利要求中任一项所述的方法(100),其中,所述神经网络(150)使用残差神经网络,其额外地利用了跳过连接和/或捷径以跳过至少一层,优选地其中所述残差神经网络包含50层或更多层;或者使用inception网络,其结合具有不同核大小的卷积,优选具有3
×
3核的两个卷积;或者使用DenseNet,其使用密集块,其中每层接收来自所有先前层的输入,优选是具有121层的DenseNet。12.根据权利要求11所述的方法(100),其中,通用图像数据集还被提供,并且在利用步骤a)和步骤b)的数字图像(120)进行训练所述神经网络之前,所述神经网络(150)利用大的通用图像数据集进行预训练。13.根据权利要求11或12所述的方法(100),其中,步骤a)和步骤b)的所述数字图像(120)被提供有相同的标准化大小,优选地其中在预训练的情况下步骤a)和步骤b)的所述数字图像(120)被提供有与用于预训练的图像数据相同的标准化大小,优选地其中图像大小是(64,128)、(128,256)、(192,384)、(256,512)或(299,299)中的一个,更优选地(64,128)。14.根据前述权利要求中任一项所述的方法(100),其中,所述方法(100)在步骤a)和步骤b)中使用总计8个或更多个、16个或更多个、或32个或更多个数字图像(120)的批量大小。15.根据前述权利要求中任一项所述的方法(100...

【专利技术属性】
技术研发人员:约翰
申请(专利权)人:欧洲中央银行
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1