基于自动神经网络架构搜索的图像欺诈检测方法及装置制造方法及图纸

技术编号：35174641 阅读：22 留言：0更新日期：2022-10-12 17:40

本发明专利技术公开了一种基于自动神经网络架构搜索的图像欺诈检测方法及装置，本发明专利技术采用集成自动化的图像预处理方法实现样本数据质量的提升，帮助后续欺诈图像检测模型训练过程中的快速收敛和减少非相关数据干扰；使用数据联邦训练的形式，在保护数据隐私的前提下，安全有效的融合不同机构已有欺诈图像样本数据以构建更加准确的深度神经网络模型，快速识别不同种类的欺诈图像；使用神经网络架构搜索策略自动化地完成对联邦模型的架构寻优，减少深度神经网络模型设计与训练阶段的专家人力成本，同时也减少多轮次重复训练的通信开销与计算资源开销。资源开销。资源开销。

全部详细技术资料下载

【技术实现步骤摘要】
基于自动神经网络架构搜索的图像欺诈检测方法及装置

[0001]本专利技术涉及自动机器学习、卷积神经网络、计算机视觉、联邦学习等
，特别涉及一种基于自动神经网络架构搜索的图像欺诈检测方法及装置。

技术介绍

[0002]随着数字化技术在金融行业的不断推广应用，越来越多的金融业务流程向着线上化、远程化、数智化方向演进。金融机构在受理账户开设、贷款申请、保险购买等业务流程中，客户会将各种申请材料转换为电子图像的形式上传。但根据行业风险案例梳理发现，不少申请材料存在有欺诈行为，如模糊图像、翻拍图像、深度合成图像等，这对金融业准入审核系统提出了更高的技术要求。
[0003]准确高效的欺诈图像检测模型需要依赖足够充足的训练样本数据，但往往每家金融机构持有的数据样本较少，不足以满足深度神经网络模型的训练要求，但由于对数据隐私的保护以及行业监管要求，各机构本地数据不可以进行直接共享。
[0004]此外，不同地区或者不同领域的各家机构持有样本数据质量参差不齐，且样本数据的分布具有非独立同分布特性（Non
‑
IID），直接使用预定义的模型架构可能并不是最优的神经网络选择，由于数据的分布对研发人员来说是黑盒且抽象的，为了找到效果更好的模型架构，研发人员必须设计或选择多个预选架构，然后通过远程调整模型的超参数以适应Non
‑
IID的数据，然而这个过程的计算开销会变得巨大，整个项目的研发周期也会加长。

技术实现思路

[0005]针对各机构间数据壁垒的现实情况、样本的分布特...

【技术保护点】

【技术特征摘要】
1.一种基于自动神经网络架构搜索的图像欺诈检测方法，其特征在于，包括以下步骤：S1，各机构对本地图像样本数据进行预处理，并将预处理完成的样本数据维护到各机构部署的联邦节点服务器，得到训练数据集和验证数据集；S2，各节点使用初始卷积神经网络架构对输入图像进行特征提取，完成初始本地欺诈图像检测模型的训练；S3，定义联邦卷积神经网络模型的学习过程；S4，确定搜索空间，将卷积神经网络架构的搜索空间描述为多个表征点和多个变换操作通过有序序列组成的有向无环图；S5，各节点进行卷积神经网络架构搜索，寻找最优的卷积神经网络权重和卷积神经网络架构，并发送给中央服务端；S6，中央服务端将各节点最优的卷积神经网络权重和卷积神经网络架构进行聚合，得到全局最优的卷积神经网络权重和卷积神经网络架构，并返回给各节点；S7，各节点更新各自的卷积神经网络模型的卷积神经网络权重和卷积神经网络架构，进行多轮搜索直到当前卷积神经网络模型的评估指标达到预期，各节点使用最优的卷积神经网络架构完成欺诈图像检测模型训练，并将训练中间值加密发送给中央服务端；S8，中央服务端接收来自各节点的训练中间值，联合构建最优全局欺诈图像检测模型，并分发到各节点；S9，各节点获得最优全局欺诈图像检测模型后，部署模型到业务系统进行在线检测。2.根据权利要求1所述的方法，其特征在于，步骤S1中，所述本地图像为金融业准入审核系统中的金融准入材料图像，本地图像样本数据中具有已标注的欺诈类别标签，包括翻拍图像欺诈、深度合成图像欺诈、模糊图像欺诈、非彩色原件欺诈。3.根据权利要求1所述的方法，其特征在于，步骤S1中，各机构对本地图像样本数据进行集成自动化预处理，包括样本去重、无效样本删除、图像尺寸统一、自动数据脱敏、图像数据归一化处理。4.根据权利要求3所述的方法，其特征在于，所述图像尺寸统一具体为：对原始图像进行自动化统一缩放，并进行像素区域关系重采样；所述自动数据脱敏具体为：将本地图像中的敏感数据做遮罩处理，对于特殊号码先采用OCR进行字符识别，判定为敏感数据则自动做遮罩处理；对于脸部信息先采用目标识别算法进行人脸检测，判定为敏感数据则自动做遮罩处理；所述图像数据归一化具体为：将原始图像每个像素值的取值范围统一批量地转换至[0,1]。5.根据权利要求1所述的方法，其特征在于，所述初始卷积神经网络架构包括以下三个网络单元：第一网络单元包含一个卷积层，该卷积层由32个大小为7*7、步长为1的卷积核以及步长为1的池化层组成，然后通过两次最大值合并得到统一特征图；第二网络单元包含三个依次连接的卷积层，每个卷积层都由16个大小为3*3、步长为1的卷积核以及步长...

【专利技术属性】
技术研发人员：曹旭涛，陈嘉俊，杨国正，张敬之，臧铖，吴美学，
申请(专利权)人：易企银杭州科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人