深度学习模型的建立方法、数据处理方法及装置制造方法及图纸

技术编号:33298238 阅读:14 留言:0更新日期:2022-05-06 12:03
本发明专利技术提供了一种深度学习模型的建立方法、数据处理方法及装置,首先通过对原始样本数据进行力度较小的数据增广处理,获取第一样本数据和第二样本数据,并利用初始深度学习模型处理第一样本数据直接获取第一特征向量,但在利用初始深度学习模型处理第二样本数据时,修改第二样本数据对应的目标特征图的尺寸,相当于在特征空间中对第二样本数据进行了进一步的隐形数据增广,由于不是基于原始样本数据的数据本身进行的数据增广,从而可以确保针对于第二样本数据的处理较为适中,使得第一特征向量和第二特征向量之间在特征空间上有合适的距离,有利于进一步基于这些特征向量对初始深度学习模型进行训练,从而提高了目标深度学习模型的精度。习模型的精度。习模型的精度。

【技术实现步骤摘要】
深度学习模型的建立方法、数据处理方法及装置


[0001]本专利技术属于计算机
,特别是涉及一种深度学习模型的建立方法、数据处理方法及装置。

技术介绍

[0002]相较于采用具有标注信息的监督学习算法,计算机视觉相关的对比自监督学习算法不需要进行繁重的数据标注过程,因此,对比自监督学习算法在计算机视觉
获得了广泛的应用。
[0003]目前,计算机视觉
的对比自监督学习算法,是将同一张未经标注的原始样本图片,经过随机图像亮度、对比度调整和随机剪裁等数据增广处理,从而得到多张增广样本图片,其中,多张增广样本图片可以看作是原始样本图片的不同视角,多张增广样本图片与原始样本图片组成正样本图片分类,正样本图片分类中样本图片之间的相似度较高;原始样本图片与除增广样本图片之外的样本图片组成负样本图片分类,负样本图片分类中样本图片之间的相似度很低,因此,正样本图片分类和负样本图片分类中的样本图片相当于经过了信息标注的样本图片,利用得到的正样本图片分类和负样本图片分类中的样本图片训练深度学习模型,从而可以得到应用于计算机视觉相关任务的深度学习模型。
[0004]但是,在目前的方案中,无法准确的控制数据增广处理的力度,若数据增广处理的力度较大,则多个增广样本图片之间的差异较大,深度学习模型训练难度较大,若数据增广处理的力度较小,则多个增广样本图片太过相似,深度学习模型训练并不能从增广样本图片中获取较多的信息,使得最终得到的深度学习模型精度较差。

技术实现思路

[0005]本专利技术提供一种深度学习模型的建立方法、数据处理方法及装置,以便解决现有技术中无法准确的控制数据增广处理的力度的问题。
[0006]为了解决上述技术问题,本专利技术是这样实现的:
[0007]第一方面,本专利技术实施例提供了一种深度学习模型的建立方法,该方法可以包括:
[0008]确定第一样本数据和第二样本数据,所述第一样本数据和所述第二样本数据是由同一原始样本数据经过数据增广处理后得到的,所述第一样本数据和所述第二样本数据之间的特征差异值小于预设特征差异值;
[0009]在将所述第一样本数据输入初始深度学习模型之后,得到所述初始深度学习模型输出的第一特征向量;
[0010]在将所述第二样本数据输入所述初始深度学习模型,分别提取所述第二样本数据的多张特征图,并对所述多张特征图中的任一特征图的尺寸进行修改之后,得到所述初始深度学习模型输出的第二特征向量;
[0011]根据所述第一特征向量、所述第二特征向量和预设的损失函数训练所述初始深度学习模型,得到目标深度学习模型。
[0012]第二方面,本专利技术实施例提供了一种数据处理方法,该方法可以包括:
[0013]获取待处理图像;
[0014]将所述待处理图像输入深度学习模型进行处理,输出针对所述待处理图像的处理结果。
[0015]第三方面,本专利技术实施例提供了一种深度学习模型的建立装置,该深度学习模型的建立装置可以包括:
[0016]确定模块,用于确定第一样本数据和第二样本数据,所述第一样本数据和所述第二样本数据是由同一原始样本数据经过数据增广处理后得到的,所述第一样本数据和所述第二样本数据之间的特征差异值小于预设特征差异值;
[0017]第一生成模块,用于在将所述第一样本数据输入初始深度学习模型之后,得到所述初始深度学习模型输出的第一特征向量;
[0018]第二生成模块,用于在将所述第二样本数据输入所述初始深度学习模型,分别提取所述第二样本数据的多张特征图,并对所述多张特征图中的任一特征图的尺寸进行修改之后,得到所述初始深度学习模型输出的第二特征向量;
[0019]训练模块,用于根据所述第一特征向量、所述第二特征向量和预设的损失函数训练所述初始深度学习模型,得到目标深度学习模型。
[0020]第四方面,本专利技术实施例提供了一种数据处理装置,该装置可以包括:
[0021]获取模块,用于获取待处理图像;
[0022]处理模块,用于将所述待处理图像输入深度学习模型进行处理,输出针对所述待处理图像的处理结果。
[0023]本专利技术实施例的第五方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现上述所述的深度学习模型的建立方法的步骤。
[0024]本专利技术实施例的第六方面,提供了一种装置,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述所述的深度学习模型的建立方法的步骤。
[0025]本专利技术实施例的第七方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现上述所述的数据处理方法的步骤。
[0026]本专利技术实施例的第八方面,提供了一种装置,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述所述的数据处理方法的步骤。
[0027]在本专利技术实施例中,首先通过对原始样本数据进行力度较小的数据增广处理,获取第一样本数据和第二样本数据,并利用初始深度学习模型处理第一样本数据直接获取第一特征向量,但在利用初始深度学习模型处理第二样本数据时,通过修改第二样本数据对应的目标特征图的尺寸,使得获取到的第二特征向量相当于在特征空间中进行了进一步的隐形数据增广,由于不是基于原始样本数据的数据本身进行的数据增广,从而可以确保针对于第二样本数据的处理较为适中,使得表征同一原始样本数据两种视角的第一特征向量和第二特征向量之间在特征空间上有合适的距离,有利于进一步基于这些特征向量对初始
深度学习模型进行训练,从而提高了目标深度学习模型的精度。
附图说明
[0028]图1是本专利技术实施例提供的一种深度学习模型的建立方法的步骤流程图;
[0029]图2是本专利技术实施例提供的一种数据处理方法的步骤流程图;
[0030]图3是本专利技术实施例提供的一种深度学习模型的建立方法的具体步骤流程图;
[0031]图4是本专利技术实施例提供的一种深度学习模型的建立方法的示意图;
[0032]图5是本专利技术实施例提供的一种深度学习模型的建立装置的框图;
[0033]图6是本专利技术实施例提供的一种数据处理装置的框图;
[0034]图7是本专利技术实施例提供的一种装置的框图。
具体实施方式
[0035]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0036]图1是本专利技术实施例提供的一种深度学习模型的建立方法的步骤流程图,如图1所示,该方法可以包括:
[0037]步骤101、确定第一样本数据和第二样本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种深度学习模型的建立方法,其特征在于,所述方法包括:确定第一样本数据和第二样本数据,所述第一样本数据和所述第二样本数据是由同一原始样本数据经过数据增广处理后得到的,所述第一样本数据和所述第二样本数据之间的特征差异值小于预设特征差异值;在将所述第一样本数据输入初始深度学习模型之后,得到所述初始深度学习模型输出的第一特征向量;在将所述第二样本数据输入所述初始深度学习模型,分别提取所述第二样本数据的多张特征图,并对所述多张特征图中的任一特征图的尺寸进行修改之后,得到所述初始深度学习模型输出的第二特征向量;根据所述第一特征向量、所述第二特征向量和预设的损失函数训练所述初始深度学习模型,得到目标深度学习模型。2.根据权利要求1所述的方法,其特征在于,所述对所述多张特征图中的任一特征图的尺寸进行修改的步骤,包括:将所述多张特征图中的任一特征图确定为目标特征图,并将所述目标特征图的尺寸缩小。3.根据权利要求2所述的方法,其特征在于,所述将所述目标特征图的尺寸缩小的步骤,包括:确定预设值,所述预设值包括数值范围大于0,小于1内的任意一个数值;将所述目标特征图的长和宽分别乘以所述预设值,得到修改后的目标特征图。4.根据权利要求3所述的方法,其特征在于,所述数值范围包括0.5至0.75。5.根据权利要求2至4中任一项所述的方法,其特征在于,所述初始深度学习模型中包括多层依次连接的卷积层,其中,上一层卷积层输出的特征图作为下一层卷积层的输入,所述目标特征图为目标卷积层输出的特征图,所述目标卷积层为所述多层依次连接的卷积层中的任意一层。6.根据权利要求1至4中任一项所述的方法,其特征在于,所述在将所述第二样本数据输入所述初始深度学习模型,分别提取所述第二样本数据的多张特征图,并对所述多张特征图中的任一特征图的尺寸进行修改之后,得到所述初始深度学习模型输出的第二特征向量的步骤,包括:将所述第二样本数据输入所述初始深度学习模型,分别提取所述第二样本数据的多张特征图,并对所述多张特征图中的任一特征图的尺寸进行修改;由所述初始深度学习模型中的全局池化层对修改后的特征图进行全局池化操作,将所述修改后的特征图全局池化为一维数据;所述初始深度学习模型根据所述一维数据输出所述第二特征向量,所述第二特征向量与所述第一特征向量具有相同的长度。7.根据权利要求1至4中任一项所述的方法,其特征在于,在所述原始样本数据为原始样本图片的情况下,所述数据增广处理包括:随机裁剪所述原始样本图片、随机扰动所述原始样本图片的亮度、对比度和饱和度中的任意一种或多种。8.根据权利要求1至4中任一项所述的方法,其特征在于,在包含多个第一样本数据和多个...

【专利技术属性】
技术研发人员:黄俊强
申请(专利权)人:内蒙古旷视金智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1