基于自动神经网络架构搜索的图像欺诈检测方法及装置制造方法及图纸

技术编号:35174641 阅读:22 留言:0更新日期:2022-10-12 17:40
本发明专利技术公开了一种基于自动神经网络架构搜索的图像欺诈检测方法及装置,本发明专利技术采用集成自动化的图像预处理方法实现样本数据质量的提升,帮助后续欺诈图像检测模型训练过程中的快速收敛和减少非相关数据干扰;使用数据联邦训练的形式,在保护数据隐私的前提下,安全有效的融合不同机构已有欺诈图像样本数据以构建更加准确的深度神经网络模型,快速识别不同种类的欺诈图像;使用神经网络架构搜索策略自动化地完成对联邦模型的架构寻优,减少深度神经网络模型设计与训练阶段的专家人力成本,同时也减少多轮次重复训练的通信开销与计算资源开销。资源开销。资源开销。

【技术实现步骤摘要】
基于自动神经网络架构搜索的图像欺诈检测方法及装置


[0001]本专利技术涉及自动机器学习、卷积神经网络、计算机视觉、联邦学习等
,特别涉及一种基于自动神经网络架构搜索的图像欺诈检测方法及装置。

技术介绍

[0002]随着数字化技术在金融行业的不断推广应用,越来越多的金融业务流程向着线上化、远程化、数智化方向演进。金融机构在受理账户开设、贷款申请、保险购买等业务流程中,客户会将各种申请材料转换为电子图像的形式上传。但根据行业风险案例梳理发现,不少申请材料存在有欺诈行为,如模糊图像、翻拍图像、深度合成图像等,这对金融业准入审核系统提出了更高的技术要求。
[0003]准确高效的欺诈图像检测模型需要依赖足够充足的训练样本数据,但往往每家金融机构持有的数据样本较少,不足以满足深度神经网络模型的训练要求,但由于对数据隐私的保护以及行业监管要求,各机构本地数据不可以进行直接共享。
[0004]此外,不同地区或者不同领域的各家机构持有样本数据质量参差不齐,且样本数据的分布具有非独立同分布特性(Non

IID),直接使用预定义的模型架构可能并不是最优的神经网络选择,由于数据的分布对研发人员来说是黑盒且抽象的,为了找到效果更好的模型架构,研发人员必须设计或选择多个预选架构,然后通过远程调整模型的超参数以适应Non

IID的数据,然而这个过程的计算开销会变得巨大,整个项目的研发周期也会加长。

技术实现思路

[0005]针对各机构间数据壁垒的现实情况、样本的分布特点、样本的质量水平,以及现有技术痛点和难点,本专利技术提出了一种基于自动神经网络架构搜索的图像欺诈检测方法及装置,用于打破各机构数据壁垒的同时,减少专家人工参与成本,自动完成金融准入材料图像的预处理,并且能够快速寻找最适合当前样本数据的分布式深度神经网络架构,以提高欺诈图像的检测效果。
[0006]本专利技术的目的是通过以下技术方案来实现的:根据本说明书的第一方面,提供一种基于自动神经网络架构搜索的图像欺诈检测方法,包括以下步骤:S1,各机构对本地图像样本数据进行预处理,并将预处理完成的样本数据维护到各机构部署的联邦节点服务器,得到训练数据集和验证数据集;S2,各节点使用初始卷积神经网络架构对输入图像进行特征提取,完成初始本地欺诈图像检测模型的训练;S3,定义联邦卷积神经网络模型的学习过程;S4,确定搜索空间,将卷积神经网络架构的搜索空间描述为多个表征点和多个变换操作通过有序序列组成的有向无环图;S5,各节点进行卷积神经网络架构搜索,寻找最优的卷积神经网络权重和卷积神
经网络架构,并发送给中央服务端;S6,中央服务端将各节点最优的卷积神经网络权重和卷积神经网络架构进行聚合,得到全局最优的卷积神经网络权重和卷积神经网络架构,并返回给各节点;S7,各节点更新各自的卷积神经网络模型的卷积神经网络权重和卷积神经网络架构,进行多轮搜索直到当前卷积神经网络模型的评估指标达到预期,各节点使用最优的卷积神经网络架构完成欺诈图像检测模型训练,并将训练中间值加密发送给中央服务端;S8,中央服务端接收来自各节点的训练中间值,联合构建最优全局欺诈图像检测模型,并分发到各节点;S9,各节点获得最优全局欺诈图像检测模型后,部署模型到业务系统进行在线检测。
[0007]进一步地,步骤S1中,所述本地图像为金融业准入审核系统中的金融准入材料图像,本地图像样本数据中具有已标注的欺诈类别标签,包括翻拍图像欺诈、深度合成图像欺诈、模糊图像欺诈、非彩色原件欺诈。
[0008]进一步地,步骤S1中,各机构对本地图像样本数据进行集成自动化预处理,包括样本去重、无效样本删除、图像尺寸统一、自动数据脱敏、图像数据归一化处理。
[0009]进一步地,所述图像尺寸统一具体为:对原始图像进行自动化统一缩放,并进行像素区域关系重采样;所述自动数据脱敏具体为:将本地图像中的敏感数据做遮罩处理,对于特殊号码先采用OCR进行字符识别,判定为敏感数据则自动做遮罩处理;对于脸部信息先采用目标识别算法进行人脸检测,判定为敏感数据则自动做遮罩处理;所述图像数据归一化具体为:将原始图像每个像素值的取值范围统一批量地转换至[0,1]。
[0010]进一步地,所述初始卷积神经网络架构包括以下三个网络单元:第一网络单元包含一个卷积层,该卷积层由32个大小为7*7、步长为1的卷积核以及步长为1的池化层组成,然后通过两次最大值合并得到统一特征图;第二网络单元包含三个依次连接的卷积层,每个卷积层都由16个大小为3*3、步长为1的卷积核以及步长为4的池化层组成;第三网络单元包含依次连接的Dropout层、两个全连接层和输出层,输出层的激活函数为Softmax函数,通过全连接层和输出层反馈图像类别的识别结果,包括正常图像、各类疑似欺诈图像。进一步地,步骤S3具体为:假设有K个联邦节点与一个中央服务端进行交互,则最终要寻找到一个最优的全局模型,寻优过程如下:其中,函数表示在节点i的数据分布下的损失期望,表示如下:
其中,表示卷积神经网络权重,表示卷积神经网络架构,和对应当前全局模型,是根据节点i的数据分布随机抽取的样本数据,是对应于样本数据和全局模型的损失函数,表示在和的条件下,损失函数的期望;为所有联邦节点的损失期望平均值,寻找的最小值对应的和,得到最优全局模型。
[0011]进一步地,步骤S4中,每个表征点都是由上一个表征点通过变换操作计算得到的,表示如下:其中,a表示当前表征点,b表示下一个表征点,为当前表征点的状态,为下一个表征点的状态,表示在a与b之间的变换操作,表示在状态下做变换操作后的结果;将所有候选变换操作表示为一组向量,对候选变换操作的选定过程做Softmax处理,表示如下:其中,Q是所有候选操作的集合,q为集合Q中的一项操作,i为K个联邦节点中当前参与架构搜索的节点,为节点i的卷积神经网络架构,为节点i在操作q下的卷积神经网络架构,为节点i在两个表征点a、b间的一个向量,为节点i在操作q下两个表征点a、b间的一个向量,表示所有候选变换操作向量映射后的概率分布。
[0012]进一步地,步骤S5中,各节点寻找最优的卷积神经网络权重和卷积神经网络架构,寻优过程如下:其中,代表本地训练数据集的损失,代表本地验证数据集的损失,分别代表对表示卷积神经网络权重和卷积神经网络架构在空间各方向上的梯度计算,代表优化过程中的学习率,代表用于均衡训练数据集损失和验证数据集损失的超参数。
[0013]进一步地,步骤S6中,中央服务端收到各节点最优的卷积神经网络权重和卷积神
经网络架构后,通过加权平均的方式聚合,得到全局最优的卷积神经网络权重和卷积神经网络架构,权值为各节点的联邦影响因子,由节点本地数据量大小占所有节点全部数据量大小的比例确定。
[0014]根据本说明书的第二方面,提供一种基于自动神经网络架构搜索的图像欺诈检测装置,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,用于实现如第一方面所述的基本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自动神经网络架构搜索的图像欺诈检测方法,其特征在于,包括以下步骤:S1,各机构对本地图像样本数据进行预处理,并将预处理完成的样本数据维护到各机构部署的联邦节点服务器,得到训练数据集和验证数据集;S2,各节点使用初始卷积神经网络架构对输入图像进行特征提取,完成初始本地欺诈图像检测模型的训练;S3,定义联邦卷积神经网络模型的学习过程;S4,确定搜索空间,将卷积神经网络架构的搜索空间描述为多个表征点和多个变换操作通过有序序列组成的有向无环图;S5,各节点进行卷积神经网络架构搜索,寻找最优的卷积神经网络权重和卷积神经网络架构,并发送给中央服务端;S6,中央服务端将各节点最优的卷积神经网络权重和卷积神经网络架构进行聚合,得到全局最优的卷积神经网络权重和卷积神经网络架构,并返回给各节点;S7,各节点更新各自的卷积神经网络模型的卷积神经网络权重和卷积神经网络架构,进行多轮搜索直到当前卷积神经网络模型的评估指标达到预期,各节点使用最优的卷积神经网络架构完成欺诈图像检测模型训练,并将训练中间值加密发送给中央服务端;S8,中央服务端接收来自各节点的训练中间值,联合构建最优全局欺诈图像检测模型,并分发到各节点;S9,各节点获得最优全局欺诈图像检测模型后,部署模型到业务系统进行在线检测。2.根据权利要求1所述的方法,其特征在于,步骤S1中,所述本地图像为金融业准入审核系统中的金融准入材料图像,本地图像样本数据中具有已标注的欺诈类别标签,包括翻拍图像欺诈、深度合成图像欺诈、模糊图像欺诈、非彩色原件欺诈。3.根据权利要求1所述的方法,其特征在于,步骤S1中,各机构对本地图像样本数据进行集成自动化预处理,包括样本去重、无效样本删除、图像尺寸统一、自动数据脱敏、图像数据归一化处理。4.根据权利要求3所述的方法,其特征在于,所述图像尺寸统一具体为:对原始图像进行自动化统一缩放,并进行像素区域关系重采样;所述自动数据脱敏具体为:将本地图像中的敏感数据做遮罩处理,对于特殊号码先采用OCR进行字符识别,判定为敏感数据则自动做遮罩处理;对于脸部信息先采用目标识别算法进行人脸检测,判定为敏感数据则自动做遮罩处理;所述图像数据归一化具体为:将原始图像每个像素值的取值范围统一批量地转换至[0,1]。5.根据权利要求1所述的方法,其特征在于,所述初始卷积神经网络架构包括以下三个网络单元:第一网络单元包含一个卷积层,该卷积层由32个大小为7*7、步长为1的卷积核以及步长为1的池化层组成,然后通过两次最大值合并得到统一特征图;第二网络单元包含三个依次连接的卷积层,每个卷积层都由16个大小为3*3、步长为1的卷积核以及步长...

【专利技术属性】
技术研发人员:曹旭涛陈嘉俊杨国正张敬之臧铖吴美学
申请(专利权)人:易企银杭州科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1