深度学习模型的建立方法、数据处理方法及装置制造方法及图纸

技术编号：33298238 阅读：14 留言：0更新日期：2022-05-06 12:03

本发明专利技术提供了一种深度学习模型的建立方法、数据处理方法及装置，首先通过对原始样本数据进行力度较小的数据增广处理，获取第一样本数据和第二样本数据，并利用初始深度学习模型处理第一样本数据直接获取第一特征向量，但在利用初始深度学习模型处理第二样本数据时，修改第二样本数据对应的目标特征图的尺寸，相当于在特征空间中对第二样本数据进行了进一步的隐形数据增广，由于不是基于原始样本数据的数据本身进行的数据增广，从而可以确保针对于第二样本数据的处理较为适中，使得第一特征向量和第二特征向量之间在特征空间上有合适的距离，有利于进一步基于这些特征向量对初始深度学习模型进行训练，从而提高了目标深度学习模型的精度。习模型的精度。习模型的精度。

全部详细技术资料下载

【技术实现步骤摘要】
深度学习模型的建立方法、数据处理方法及装置

[0001]本专利技术属于计算机
，特别是涉及一种深度学习模型的建立方法、数据处理方法及装置。

技术介绍

[0002]相较于采用具有标注信息的监督学习算法，计算机视觉相关的对比自监督学习算法不需要进行繁重的数据标注过程，因此，对比自监督学习算法在计算机视觉
获得了广泛的应用。
[0003]目前，计算机视觉
的对比自监督学习算法，是将同一张未经标注的原始样本图片，经过随机图像亮度、对比度调整和随机剪裁等数据增广处理，从而得到多张增广样本图片，其中，多张增广样本图片可以看作是原始样本图片的不同视角，多张增广样本图片与原始样本图片组成正样本图片分类，正样本图片分类中样本图片之间的相似度较高；原始样本图片与除增广样本图片之外的样本图片组成负样本图片分类，负样本图片分类中样本图片之间的相似度很低，因此，正样本图片分类和负样本图片分类中的样本图片相当于经过了信息标注的样本图片，利用得到的正样本图片分类和负样本图片分类中的样本图片训练深度学习模型，从而可以得到应用于计算机视觉相关任务的深度学习模型。
[0004]但是，在目前的方案中，无法准确的控制数据增广处理的力度，若数据增广处理的力度较大，则多个增广样本图片之间的差异较大，深度学习模型训练难度较大，若数据增广处理的力度较小，则多个增广样本图片太过相似，深度学习模型训练并不能从增广样本图片中获取较多的信息，使得最终得到的深度学习模型精度较差。

技术实现思路

[0005]本专利技术提供一种...

【技术保护点】

【技术特征摘要】
1.一种深度学习模型的建立方法，其特征在于，所述方法包括：确定第一样本数据和第二样本数据，所述第一样本数据和所述第二样本数据是由同一原始样本数据经过数据增广处理后得到的，所述第一样本数据和所述第二样本数据之间的特征差异值小于预设特征差异值；在将所述第一样本数据输入初始深度学习模型之后，得到所述初始深度学习模型输出的第一特征向量；在将所述第二样本数据输入所述初始深度学习模型，分别提取所述第二样本数据的多张特征图，并对所述多张特征图中的任一特征图的尺寸进行修改之后，得到所述初始深度学习模型输出的第二特征向量；根据所述第一特征向量、所述第二特征向量和预设的损失函数训练所述初始深度学习模型，得到目标深度学习模型。2.根据权利要求1所述的方法，其特征在于，所述对所述多张特征图中的任一特征图的尺寸进行修改的步骤，包括：将所述多张特征图中的任一特征图确定为目标特征图，并将所述目标特征图的尺寸缩小。3.根据权利要求2所述的方法，其特征在于，所述将所述目标特征图的尺寸缩小的步骤，包括：确定预设值，所述预设值包括数值范围大于0，小于1内的任意一个数值；将所述目标特征图的长和宽分别乘以所述预设值，得到修改后的目标特征图。4.根据权利要求3所述的方法，其特征在于，所述数值范围包括0.5至0.75。5.根据权利要求2至4中任一项所述的方法，其特征在于，所述初始深度学习模型中包括多层依次连接的卷积层，其中，上一层卷积层输出的特征图作为下一层卷积层的输入，所述目标特征图为目标卷积层输出的特征图，所述目标卷积层为所述多层依次连接的卷积层中的任意一层。6.根据权利要求1至4中任一项所述的方法，其特征在于，所述在将所述第二样本数据输入所述初始深度学习模型，分别提取所述第二样本数据的多张特征图，并对所述多张特征图中的任一特征图的尺寸进行修改之后，得到所述初始深度学习模型输出的第二特征向量的步骤，包括：将所述第二样本数据输入所述初始深度学习模型，分别提取所述第二样本数据的多张特征图，并对所述多张特征图中的任一特征图的尺寸进行修改；由所述初始深度学习模型中的全局池化层对修改后的特征图进行全局池化操作，将所述修改后的特征图全局池化为一维数据；所述初始深度学习模型根据所述一维数据输出所述第二特征向量，所述第二特征向量与所述第一特征向量具有相同的长度。7.根据权利要求1至4中任一项所述的方法，其特征在于，在所述原始样本数据为原始样本图片的情况下，所述数据增广处理包括：随机裁剪所述原始样本图片、随机扰动所述原始样本图片的亮度、对比度和饱和度中的任意一种或多种。8.根据权利要求1至4中任一项所述的方法，其特征在于，在包含多个第一样本数据和多个...

【专利技术属性】
技术研发人员：黄俊强，
申请(专利权)人：内蒙古旷视金智科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人