【技术实现步骤摘要】
一种图像数据处理方法、装置、计算机设备及存储介质
[0001]本申请涉及计算机
,尤其涉及一种图像数据处理方法、装置、计算机设备及存储介质。
技术介绍
[0002]目前,在通过初始特征学习模型训练得到用于进行图像识别的目标特征学习模型之前,需要预先训练一个用于进行噪声判决的噪声分类模型,并通过该噪声分类模型对参与训练的全量样本进行二分类处理,以根据二分类处理的结果对参与训练的全量样本进行噪声去除,以确保可以使用去除噪声后的全量样本来对初始特征学习模型进行迭代训练。
[0003]显然,在使用预先训练好的噪声分类模型对全量样本进行二分类处理之前,需要在参与训练的全量样本中人工标注出噪声样本,这意味着在训练得到该噪声分类模型的过程中,不仅需要预先学习到与这些噪声样本相关的噪声特征,还需要额外学习到与这些噪声样本无关的其他特征。这意味着对于该噪声分类模型而言,一旦由该噪声分类模型所单次输出的二分类处理结果存在学习错误时,将导致用于对该初始特征学习模型进行迭代训练时的样本存在噪声干扰,从而会降低对该初始特征学习模型进行迭 ...
【技术保护点】
【技术特征摘要】
1.一种图像数据处理方法,其特征在于,包括:在获取到用于训练初始特征学习模型的批次样本时,将所述批次样本中的样本三元组作为待处理样本三元组;通过所述初始特征学习模型提取得到所述待处理样本三元组的三元组特征,将所述待处理样本三元组的三元组特征输入与所述初始特征学习模型相关联的噪声判决模型,由所述噪声判决模型根据所述初始特征学习模型的迭代次数和所述噪声判决模型所维护的离群阈值参数,对所述待处理样本三元组进行噪声判决,得到所述待处理样本三元组的噪声判决结果;对所述待处理样本三元组的三元组特征进行特征量化处理,得到所述待处理样本三元组的二值量化特征,根据所述待处理样本三元组的二值量化特征和所述噪声判决结果,对所述批次样本进行联合损失学习,以得到所述批次样本的联合损失;根据所述联合损失调整所述初始特征学习模型的模型参数,基于调整模型参数后的初始特征学习模型,得到用于对待查询图像进行特征度量学习的目标特征学习模型。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:在获取到全量分镜样本时,构建与所述全量分镜样本中的每个分镜样本组相关联的负样本挖掘子空间;基于所述全量分镜样本中的每个分镜样本组和与所述每个分镜样本组相关联的负样本挖掘子空间,构建用于训练初始特征学习模型的全量样本三元组;根据所述负样本挖掘子空间中的总负样本数量,对所述全量样本三元组中的样本三元组进行批次划分,得到与所述全量分镜样本相关联的批次样本。3.根据权利要求2所述的方法,其特征在于,所述在获取到全量分镜样本时,构建与所述全量分镜样本中的每个分镜样本组相关联的负样本挖掘子空间,包括:获取用于分镜处理的样本视频,对所述样本视频进行分镜处理,得到与所述样本视频相关联的N
’
个分镜样本组,将所述N
’
个分镜样本组作为所述全量分镜样本,基于所述N
’
个分镜样本组的标签信息,对所述N
’
个分镜样本组进行聚类处理,得到与所述全量分镜样本相关联的X个聚类簇;N
’
为正整数;X为正整数,且一个聚类簇对应一个标签信息;从所述全量分镜样本中获取分镜样本组i,在所述X个聚类簇中,将从与所述分镜样本组i相关联的聚类簇中抽取的K个聚类簇分别作为目标聚类簇;其中,i为小于或者等于N
’
的正整数;所述目标聚类簇的数量为K个;从K个所述目标聚类簇所对应的局部子空间中,抽取K*M个分镜图像作为第一分镜图像,基于抽取到的K*M个第一分镜图像,构建与分镜样本组i相关联的第一类负样本空间,并从所述X个聚类簇所对应的全局子空间中,抽取K*M个分镜图像作为第二分镜图像,基于抽取到的K*M个第二分镜图像构建与分镜样本组i相关联的第二类负样本空间;所述第一类负样本空间中的第一分镜图像与所述分镜样本组i中的分镜图像具有相同的标签信息;所述第二类负样本空间中的分镜图像与所述分镜样本组i中的分镜图像具有不同的标签信息;将所述第一类负样本空间和所述第二类负样本空间作为所述分镜样本组i的负样本挖掘子空间。4.根据权利要求3所述的方法,其特征在于,所述基于所述N
’
个分镜样本组的标签信息,对所述N
’
个分镜样本组进行聚类处理,得到与所述全量分镜样本相关联的X个聚类簇,
包括:将所述全量分镜样本所包含的所述N
’
个分镜样本组输入标签预测模型,由所述标签预测模型预测输出所述N
’
个分镜样本组中的每个分镜样本组的标签信息;所述每个分镜样本组的标签信息是在对应分镜样本组中的分镜图像的标签信息的累计标签量达到累计阈值时所确定的;所述累计阈值是由所述对应分镜样本组中的分镜图像的分镜数量所决定的;在所述N
’
个分镜样本组中,按照所述每个分镜样本组的标签信息,将具有同一标签信息的分镜样本组划分到同一聚类簇,以得到与所述全量分镜样本相关联的X个聚类簇。5.根据权利要求2所述的方法,其特征在于,所述全量分镜样本包括N
’
个分镜样本组,一个分镜样本组包含U个分镜图像;N
’
和U均为正整数;与所述每个分镜样本组相关联的负样本挖掘子空间均包括第一类负样本空间和第二类负样本空间;所述基于所述全量分镜样本中的每个分镜样本组和与所述每个分镜样本组相关联的负样本挖掘子空间,构建用于训练初始特征学习模型的全量样本三元组,包括:在所述全量分镜样本中的每个分镜样本组中获取目标分镜样本组;在所述目标分镜样本组的U个分镜图像中选择一个分镜图像作为所述目标分镜样本组的锚点样本,并在所述目标分镜样本组的U个分镜图像中将除所述锚点样本之外的分镜图像作为所述目标分镜样本组的正样本,基于所述目标分镜样本组的锚点样本和所述目标分镜样本组的正样本,确定所述目标分镜样本组的正样本对;所述目标分镜样本组的正样本对的数量为U*(U
‑
1)*1/2个;在与所述目标分镜样本组相关联的负样本挖掘子空间中,抽取2*Nn个分镜图像作为所述目标分镜样本组的负样本;所述目标分镜样本组的负样本中包括Nn个难负样本和Nn个易负样本;所述Nn个难负样本是从与所述目标分镜样本组相关联的第一类负样本空间中所抽取到的;所述Nn个易负样本是从与所述目标分镜样本组相关联的第二类负样本空间中所抽取到的;根据所述目标分镜样本组的正样本对和所述目标分镜样本组的负样本,构建得到所述目标分镜样本组的样本三元组,直到所述全量分镜样本中的每个分镜样本组均被作为所述目标分镜样本组时,得到所述每个分镜样本组的样本三元组;所述每个分镜样本组的样本三元组的数量均为U*(U
‑
1)* Nn个;将所述每个分镜样本组的样本三元组作为用于训练初始特征学习模型的全量样本三元组。6.根据权利要求5所述的方法,其特征在于,与所述目标分镜样本组相关联的第一类负样本空间包括K*M个第一分镜图像;与所述目标分镜样本组相关联的第二类负样本空间包括K*M个第二分镜图像;K和M均为正整数;所述方法还包括:在所述目标分镜样本组的U个分镜图像中遍历选择一个分镜图像作为所述目标分镜样本组的正样本,并在所述目标分镜样本组的U个分镜图像中将除遍历到的所述正样本之外的分镜图像作为所述目标分镜样本组的锚点样本;在所述K*M个第一分镜图像中查找与所述目标分镜样本组的锚点样本相同的第一分镜图像,将查找到的与所述目标分镜样本组的锚点样本相同的第一分镜图像作为辅助挖掘图像;
在所述K*M个第一分镜图像中将除所述辅助挖掘图像之外的第一分镜图像作为待挖掘图像;所述待挖掘图像的图像数量为(K*M
‑
1)个;确定所述辅助挖掘图像与(K*M
‑
1)个所述待挖掘图像之间的第一汉明距离,将确定的最小第一汉明距离所对应的待挖掘图像作为所述辅助挖掘图像的局部难负样本,并确定所述辅助挖掘图像与K*M个第二分镜图像之间的第二汉明距离,将确定的最小第二汉明距离所对应的第二分镜图像作为所述辅助挖掘图像的全局难负样本;基于所述辅助挖掘图像的局部难负样本和所述辅助挖掘图像的全局难负样本,在所述目标分镜样本组的负样本中更新所述目标分镜样本组的难负样本。7.根据权利要求1所述的方法,其特征在于,所述通过所述初始特征学习模型提取得到所述待处理样本三元组的三元组特征,将所述待处理样本三元组的三元组特征输入与所述初始特征学习模型相关联的噪声判决模型,由所述噪声判决模型根据所述初始特征学习模型的迭代次数和所述噪声判决模型所维护的离群阈值参数,对所述待处理样本三元组进行噪声判决,得到所述待处理样本三元组的噪声判决结果,包括:将所述待处理样本三元组输入所述初始特征学习模型,由所述初始特征学习模型对所述待处理样本三元组进行特征提取和哈希量化处理,将所述初始特征学习模型所输出的所述待处理样本三元组的三元组特征作为第一迭代三元组特征;在所述初始特征学习模型的迭代次数达到初始迭代阈值时,将所述第一迭代三元组特征输入与所述初始特征学习模型相关联的噪声判决模型,由所述噪声判决模型根据与所述批次样本相关联的初始分类数据集,确定所述噪声判决模型所维护的第一离群阈值参数;基于所述初始分类数据集确定所述批次样本的初始联合损失,基于所述初始联合损失调整所述初始特征学习模型的模型参数,将调整参数后的初始特征学习模型作为过渡特征学习模型,且对所述初始特征学习模型的迭代次数进行递增处理;将所述过渡特征学习模型所输出的所述待处理样本三元组的三元组特征作为第二迭代三元组特征,且在递增处理后的迭代次数达到目标迭代阈值时,将所述第二迭代三元组特征输入所述噪声判决模型,由所述噪声判决模型根据所述噪声判决模型所维护的第一离群阈值参数,对所述待处理样本三元组进行噪声判决,得到所述待处理样本三元组的噪声判决结果。8.根据权利要求7所述的方法,其特征在于,所述将所述待处理样本三元组输入所述初始特征学习模型,由所述初始特征学习模型对所述待处理样本三元组进行特征提取和哈希量化处理,将所述初始特征学习模型所输出的所述待处理样本三元组的三元组特征作为第一迭代三元组特征,包括:将所述待处理样本三元组输入所述初始特征学习模型的基础特征网络层,由所述基础特征网络层提取所述待处理样本三元组的基础特征;将提取到的基础特征输入所述初始特征学习模型的哈希量化层,由所述哈希量化层对所述基础特征进行哈希量化处理;将哈希量化处理所得到的哈希量化特征作为所述初始特征学习模型所输出的第一迭代三元组特征。9.根据权利要求7所述的方法,其特征在于,所述在所述初始特征学习模型的迭代次数达到初始迭代阈值时,将所述第一迭代三元组特征输入与所述初始特征学习模型相关联的
噪声判决模型,由所述噪声判决模型根据与所述批次样本相关联的初始分类数据集,确定所述噪声判决模型所维护的第一离群阈值参数,包括:在所述初始特征学习模型的迭代次数达到初始迭代阈值时,将所述第一迭代三元组特征输入与所述初始特征学习模型相关联的噪声判决模型,由所述噪声判决模型将与所述待处理样本三元组相关联的分类数据集作为与所述批次样本相关联的初始分类数据集;在所述初始分类数据集中,迭代记录所述待处理样本三元组中的负样本的初始离群阈值比例;获取所述噪声判决模型在所述初始迭代阈值时的可靠性阈值,基于迭代记录的初始离群阈值比例和所述初始迭代阈值时的可靠性阈值,确定所述噪声判决模型在所述初始迭代阈值时的初...
【专利技术属性】
技术研发人员:郭卉,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。