针对图像识别模型的增强训练方法及装置制造方法及图纸

技术编号：26764415 阅读：15 留言：0更新日期：2020-12-18 23:38

本说明书实施例提供一种针对图像识别模型的增强训练方法，从第一样本集中随机选择预定数量或预定比例的样本作为种子样本，进行扩展，得到若干扩展样本。其中扩展样本在原有图像的基础上添加扰动，而标注结果不变。样本扩展过程中，扰动值以基准像素为参考，向四周呈预定分布，从而可以很好地模拟真实扰动。由于扩展样本在添加扰动后标注结果不变，经过扩展样本训练的图像识别模型可以很好地识别本来的图像的目标识别结果，从而提高图像识别模型的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
针对图像识别模型的增强训练方法及装置
本说明书一个或多个实施例涉及计算机
，尤其涉及图像扰动处理、图像样本扩展以及利用扩展样本对图像识别模型进行增强训练的方法及装置。
技术介绍
图像识别，是指利用计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对象的技术。图像识别广泛应用于多种领域，例如无人驾驶、考勤、支付认证、刑侦追踪等等。其中，在一些业务场景下，除了目标检测，还需要识别相关目标是否真实目标实体，例如在人脸支付认证场景下，从用户资金安全性考虑，为了避免使用人脸照片冒充真实的人进行支付，还需要确定人脸图像是否为活体图像。这种情况下，如果图像识别模型仅使用标准训练样本进行训练，那么在增加图像干扰的情况下，图像识别结果的准确度可能会降低，造成一定的困扰，例如人脸支付认证业务场景下的资金安全性无法保证。因此，如何提高图像识别模型的鲁棒性，至关重要。
技术实现思路
本说明书一个或多个实施例描述了一种图像扰动、扰动图像样本生成以及利用生成的扰动样本对图像识别模型的增强训练方法及装置，用以解决
技术介绍
提到的一个或多个问题。根据第一方面，提供一种针对图像识别模型的增强训练方法，包括：从第一样本集中随机选择预定数量或预定比例的样本作为种子样本，其中，各个种子样本分别对应有各个种子图像以及针对相应种子图像的标注结果；对各个种子样本分别获取基于扩展操作得到的若干扩展样本，其中，对于单个种子样本的扩展操作包括：对于所述单个种子样本对应的单个种子图像，至少在一个图像通道上，对各个像素分别...

【技术保护点】
1.一种针对图像识别模型的增强训练方法，包括：/n从第一样本集中随机选择预定数量或预定比例的样本作为种子样本，其中，各个种子样本分别对应有各个种子图像以及针对相应种子图像的标注结果；/n对各个种子样本分别获取基于扩展操作得到的若干扩展样本，其中，对于单个种子样本的扩展操作包括：对于所述单个种子样本对应的单个种子图像，至少在一个图像通道上，对各个像素分别融合以基准像素为中心呈预定分布排列的各个扰动值，得到单个扰动图像，其中，所述预定分布与各个像素到基准像素的距离相关；基于所述单个扰动图像与所述单个种子样本对应的标注结果构成单个扩展样本，所述基准像素按照预定规则确定；/n基于所述扩展样本对所述图像识别模型进行增强训练。/n

【技术特征摘要】
1.一种针对图像识别模型的增强训练方法，包括：
从第一样本集中随机选择预定数量或预定比例的样本作为种子样本，其中，各个种子样本分别对应有各个种子图像以及针对相应种子图像的标注结果；
对各个种子样本分别获取基于扩展操作得到的若干扩展样本，其中，对于单个种子样本的扩展操作包括：对于所述单个种子样本对应的单个种子图像，至少在一个图像通道上，对各个像素分别融合以基准像素为中心呈预定分布排列的各个扰动值，得到单个扰动图像，其中，所述预定分布与各个像素到基准像素的距离相关；基于所述单个扰动图像与所述单个种子样本对应的标注结果构成单个扩展样本，所述基准像素按照预定规则确定；
基于所述扩展样本对所述图像识别模型进行增强训练。

2.根据权利要求1所述的方法，其中，所述对于所述单个种子样本对应的单个种子图像，至少在一个图像通道上，对各个像素分别融合以基准像素为中心呈预定分布排列的各个扰动值，得到单个扰动图像，包括：
构建与所述单个种子图像像素排列一致的掩膜图像；
根据预定规则在所述掩膜图像上确定对应于预定的基准扰动值且与所述基准像素对应的基准点；
在所述掩膜图像上，以所述基准点为中心，向周围各个像素按照所述预定分布，生成由所述基准扰动值依次衰减或依次增强的各个扰动值，得到第一噪声图像；
基于所述第一噪声图像向所述单个种子图像的第一图像通道的融合结果，得到第一扰动图像。

3.根据权利要求1或2所述的方法，其中，所述预定分布为线性分布或正态分布。

4.根据权利要求2所述的方法，其中，所述第一噪声图像向所述单个种子图像的第一图像通道的叠加结果包括，根据预定权重，对所述第一噪声图像上的各个扰动值和所述第一图像通道的各个图像值，按照像素一一对应加权平均得到的结果。

5.根据权利要求2所述的方法，其中，所述第一扰动图像中，还包括：
所述第一噪声图像向所述单个种子图像的第二图像通道的叠加结果；或者，
其它噪声图像向所述单个种子图像的第二图像通道的叠加结果。

6.根据权利要求1所述的方法，其中，所述单个种子图像包括第一像素，所述第一像素与所述基准像素的距离为，以所在行和列为坐标，所述第一像素与所述基准像素的欧氏距离。

7.根据权利要求1所述的方法，其中，所述对于所述单个种子样本对应的单个种子图像，至少在一个图像通道上，对各个像素分别融合以基准像素为中心按照与基准像素的距离呈预定分布的各个扰动值，得到单个扰动图像，包括：
构建与所述单个种子图像像素排列一致的辅助矩阵；
根据预定规则确定所述辅助矩阵中对应于预定的基准扰动值的基准元素，所述基准元素是与所述基准像素相对应的矩阵元素；
在所述辅助矩阵中，以所述基准元素为中心向周围各个元素按照预定分布，生成由所述基准扰动值依次衰减或依次增强的各个扰动值作为相应元素值，得到第一噪声矩阵；
基于所述第一噪声矩阵向所述单个种子图像的第一图像通道的叠加结果，得到第一扰动图像。

8.根据权利要求1所述的方法，其中，所述基于所述扩展样本对所述图像识别模型进行增强训练包括：
将各个扩展样本加入所述第一样本集，利用第一样本集训练所述图像识别模型；或者，
将各个扩展样本加入第二样本集，利用所述第二样本集对经过第一样本集训练后的图像识别模型进行增强训练。

9.一种图像处理的方法，包括：
构建与待处理图像的像素排列一致的掩膜图像；
根据预定规则在所述掩膜图像上确定对应于预定的基准扰动值的基准像素；
在所述掩膜图像上，以所述基准像素为中心，向周围各个像素按照所述预定分布，生成由所述基准扰动值依次衰减或依次增强的各个扰动值，得到噪声图像；
基于所述噪声图像向所述待处理图像的第一图像通道的融合结果，形成针对所述待处理图像的扰动图像。

10.根据权利要求9所述的方法，其中，所述预定分布为线性分布或正态分布。

11.根据权利要求9所述的方法，其中，所述噪声图像向所述待处理图像的第一图像通道的叠加结果包括，根据预定权重，对所述噪声图像上的各个扰动值和所述第一图像通道的各个图像值，按照像素一一对应加权平均得到的结果。

12.根据权利要求9所述的方法，其中，所述第一扰动图像中，还包括：
所述第一噪声图像向所述单个种子图像的第二图像通道的叠加结果；或者，
其它噪...

【专利技术属性】
技术研发人员：徐文浩，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人