一种识别模型的构建方法及装置制造方法及图纸

技术编号:21157983 阅读:31 留言:0更新日期:2019-05-22 07:46
本申请提供了一种识别模型的构建方法及装置,方法包括:获取第一样本集和第二样本集,第一样本集的样本数量小于第一预设值,第二样本集的样本数量大于第二预设值,第一样本集与第二样本集中的训练样本至少具有部分相同的视觉特征;用第一样本集训练初始的第一识别模型,并获取训练得到的第一识别模型的参数作为第一目标参数,第一识别模型的输入为第一样本集中任意两个样本组成的样本对,识别目标为样本对中的两个样本是否属于同一类别;将第一目标参数作为初始的第二识别模型的初始参数,用第一样本集和第二样本集训练初始的第二识别模型,训练得到的第二识别模型作为目标识别模型。本申请使得使用较少的样本也可训练出准确度较高的识别模型。

A Method and Device for Constructing Recognition Model

This application provides a method and device for constructing an identification model. The method includes: acquiring the first sample set and the second sample set, the number of samples in the first sample set is less than the first preset value, the number of samples in the second sample set is larger than the second preset value, and the training samples in the first sample set and the second sample set have at least part of the same visual characteristics; The parameters of the first recognition model obtained from training are taken as the first target parameters. The input of the first recognition model is a pair of samples composed of any two samples in the first sample set, and the recognition target is whether two samples in the sample pair belong to the same category. The first target parameter is taken as the initial parameter of the initial second recognition model, and the first sample is used. The set and the second sample set train the initial second recognition model, and the trained second recognition model is used as the target recognition model. This application makes it possible to train recognition models with high accuracy by using fewer samples.

【技术实现步骤摘要】
一种识别模型的构建方法及装置
本申请涉及图像识别
,更具体地说,涉及一种识别模型的构建方法及装置。
技术介绍
图像识别技术指的是,给定一幅测试图像,利用预先训练好的识别模型判别它所属的类别,识别模型采用带类别标签的训练图像训练得到。可以理解的是,影响识别模型性能优劣的主要因素之一就是训练样本,通常情况,训练样本越多,通过训练样本训练得到的识别模型的性能越优。然而,在某些应用场景下,由于某种原因,能够收集到的训练样本较少,收集的训练样本较少势必导致训练得到的识别模型准确度不高,无法满足对应应用场景对识别准确度的要求。
技术实现思路
有鉴于此,本申请提供了一种识别模型的构建方法及装置,用以解决某应用场景下的训练样本较少导致训练得到的识别模型准确度不高,无法满足该应用场景对识别准确度的要求的问题,其技术方案如下:一种识别模型的构建方法,包括:获取第一训练样本集和第二训练样本集,其中,所述第一训练样本集的样本数量小于第一预设值,所述第二训练样本集的样本数量大于第二预设值,所述第一预设值小于所述第二预设值,所述第一训练样本集中的训练样本与所述第二训练样本集中的训练样本至少具有部分相同的视觉特征;用所述第一训练样本集训练初始的第一识别模型,并获取训练得到的第一识别模型的参数作为第一目标参数,其中,第一识别模型的输入为所述第一训练样本集中的任意两个训练样本组成的训练样本对,所述第一识别模型的识别目标为输入的训练样本对中的两个训练样本是否属于同一类别;将所述第一目标参数作为初始的第二识别模型的初始参数,用所述第一训练样本集和所述第二训练样本集训练所述初始的第二识别模型,训练得到的第二识别模型作为目标识别模型。可选的,所述初始的第一识别模型的初始参数为第二目标参数;获取所述第二目标参数的过程包括:用所述第二训练样本集训练初始的第三识别模型,获取训练得到的第三识别模型的参数作为所述第二目标参数。其中,所述用所述第一训练样本集训练初始的第一识别模型,包括:从所述第一训练样本集中获取具有标注结果的训练样本对,其中,所述标注结果至少包括用于指示所述训练样本对中的两个训练样本是否属于同一类别的第一标注结果;将所述具有标注结果的训练样本对输入所述初始的第一识别模型,获得输入的训练样本对所对应的识别结果,该识别结果用于指示所述输入的训练样本对中的两个训练样本是否属于同一类别;基于所述输入的训练样本对所对应的识别结果、所述输入的训练样本对的标注结果以及预设的损失函数,更新所述初始的第一识别模型的参数。其中,所述预设的损失函数为基于对比的损失函数,或者,为由基于交叉熵的损失函数和所述基于对比的损失函数组成的损失函数,其中,所述基于对比的损失函数用于使第一识别模型能够学习到不同类别样本的差异;若所述预设的损失函数为所述基于对比的损失函数,则所述训练样本对的标注结果包括用于指示所述训练样本对中的两个训练样本是否属于同一类别的第一标注结果;若所述预设的损失函数为由所述基于交叉熵的损失函数和所述基于对比的损失函数组成的损失函数,则所述训练样本对的标注结果包括用于指示所述训练样本对中的两个训练样本是否属于同一类别的第一标注结果,以及,用于指示所述训练样本对中两个训练样本分别所属类别的第二标注结果。其中,所述第一识别模型、所述第二识别模型和所述第三识别模型中的任一识别模型包括:特征提取模块、特征规范化处理模块和分类模块;所述特征提取模块,用于从输入的训练样本或训练样本对中提取样本特征;所述特征规范化处理模块,用于对所述特征提取模块提取的样本特征进行规范化处理,以将所述特征提取模块提取的样本特征约束在高维空间的超球面上;所述分类模块,用于基于所述特征规范化处理模块进行规范化处理后的样本特征确定输入的训练样本或训练样本对所对应的识别结果。一种识别模型的构建装置,包括:样本集获取模块、第一训练模块、第一参数获取模块和第二训练模块;所述样本集获取模块,用于获取第一训练样本集和第二训练样本集,其中,所述第一训练样本集的样本数量小于第一预设值,所述第二训练样本集的样本数量大于第二预设值,所述第一预设值小于所述第二预设值,所述第一训练样本集中的训练样本与所述第二训练样本集中的训练样本至少具有部分相同的视觉特征;所述第一训练模块,用于用所述第一训练样本集训练初始的第一识别模型,其中,第一识别模型的输入为所述第一训练样本集中的任意两个训练样本组成的训练样本对,所述第一识别模型的识别目标为输入的训练样本对中的两个训练样本是否属于同一类别;所述第一参数获取模块,用于获取所述第一训练模块训练得到的第一识别模型的参数作为第一目标参数;所述第二训练模块,用于将所述第一目标参数作为初始的第二识别模型的初始参数,用所述第一训练样本集和所述第二训练样本集训练所述初始的第二识别模型,训练得到的第二识别模型作为目标识别模型。可选的,所述初始的第一识别模型的初始参数为第二目标参数;所述装置还包括:第三训练模块和第二参数获取模块;所述第三训练模块,用于用所述第二训练样本集训练初始的第三识别模型;所述第二参数获取模块,用于获取训练得到的第三识别模型的参数作为所述第二目标参数。其中,所述第一训练模块,具体用于从所述第一训练样本集中获取具有标注结果的训练样本对,其中,所述标注结果至少包括用于指示所述训练样本对中的两个训练样本是否属于同一类别的第一标注结果;将所述具有标注结果的训练样本对输入所述初始的第一识别模型,获得输入的训练样本对对应的识别结果,该识别结果用于指示所述输入的训练样本对中的两个训练样本是否属于同一类别;基于所述输入的训练样本对所对应的识别结果、所述输入的训练样本对的标注结果以及预设的损失函数,更新所述初始的第一识别模型的参数。其中,所述预设的损失函数为基于对比的损失函数,或者,为由基于交叉熵的损失函数和所述基于对比的损失函数组成的损失函数,其中,所述基于对比的损失函数用于使第一识别模型能够学习到不同类别样本的差异;若所述预设的损失函数为所述基于对比的损失函数,则所述训练样本对的标注结果包括用于指示所述训练样本对中的两个训练样本是否属于同一类别的第一标注结果;若所述预设的损失函数为由所述基于交叉熵的损失函数和所述基于对比的损失函数组成的损失函数,则所述训练样本对的标注结果包括用于指示所述训练样本对中的两个训练样本是否属于同一类别的第一标注结果,以及,用于指示所述训练样本对中两个训练样本分别所属类别的第二标注结果。其中,所述第一识别模型、所述第二识别模型和所述第三识别模型中的任一识别模型包括:特征提取模块、特征规范化处理模块和分类模块;所述特征提取模块,用于从输入的训练样本或训练样本对中提取样本特征;所述特征规范化处理模块,用于对所述特征提取模块提取的样本特征进行规范化处理,以将所述特征提取模块提取的样本特征约束在高维空间的超球面上;所述分类模块,用于基于所述特征规范化处理模块进行规范化处理后的样本特征确定输入的训练样本或训练样本对所对应的识别结果。从上述的技术方案可以看出,本申请实施例提供的识别模型的构建方法及装置中,第一识别模型的输入为从第一训练样本集中获取的任意两个训练样本组成的训练样本对,识别任务为输入的训练样本对中的两个训练样本是否属于同一类别,本申请通过将本文档来自技高网...

【技术保护点】
1.一种识别模型的构建方法,其特征在于,包括:获取第一训练样本集和第二训练样本集,其中,所述第一训练样本集的样本数量小于第一预设值,所述第二训练样本集的样本数量大于第二预设值,所述第一预设值小于所述第二预设值,所述第一训练样本集中的训练样本与所述第二训练样本集中的训练样本至少具有部分相同的视觉特征;用所述第一训练样本集训练初始的第一识别模型,并获取训练得到的第一识别模型的参数作为第一目标参数,其中,第一识别模型的输入为所述第一训练样本集中的任意两个训练样本组成的训练样本对,所述第一识别模型的识别目标为输入的训练样本对中的两个训练样本是否属于同一类别;将所述第一目标参数作为初始的第二识别模型的初始参数,用所述第一训练样本集和所述第二训练样本集训练所述初始的第二识别模型,训练得到的第二识别模型作为目标识别模型。

【技术特征摘要】
1.一种识别模型的构建方法,其特征在于,包括:获取第一训练样本集和第二训练样本集,其中,所述第一训练样本集的样本数量小于第一预设值,所述第二训练样本集的样本数量大于第二预设值,所述第一预设值小于所述第二预设值,所述第一训练样本集中的训练样本与所述第二训练样本集中的训练样本至少具有部分相同的视觉特征;用所述第一训练样本集训练初始的第一识别模型,并获取训练得到的第一识别模型的参数作为第一目标参数,其中,第一识别模型的输入为所述第一训练样本集中的任意两个训练样本组成的训练样本对,所述第一识别模型的识别目标为输入的训练样本对中的两个训练样本是否属于同一类别;将所述第一目标参数作为初始的第二识别模型的初始参数,用所述第一训练样本集和所述第二训练样本集训练所述初始的第二识别模型,训练得到的第二识别模型作为目标识别模型。2.根据权利要求1所述的识别模型的构建方法,其特征在于,所述初始的第一识别模型的初始参数为第二目标参数;获取所述第二目标参数的过程包括:用所述第二训练样本集训练初始的第三识别模型,获取训练得到的第三识别模型的参数作为所述第二目标参数。3.根据权利要求1或2所述的识别模型的构建方法,其特征在于,所述用所述第一训练样本集训练初始的第一识别模型,包括:从所述第一训练样本集中获取具有标注结果的训练样本对,其中,所述标注结果至少包括用于指示所述训练样本对中的两个训练样本是否属于同一类别的第一标注结果;将所述具有标注结果的训练样本对输入所述初始的第一识别模型,获得输入的训练样本对所对应的识别结果,该识别结果用于指示所述输入的训练样本对中的两个训练样本是否属于同一类别;基于所述输入的训练样本对所对应的识别结果、所述输入的训练样本对的标注结果以及预设的损失函数,更新所述初始的第一识别模型的参数。4.根据权利要求3所述的识别模型的构建方法,其特征在于,所述预设的损失函数为基于对比的损失函数,或者,为由基于交叉熵的损失函数和所述基于对比的损失函数组成的损失函数,其中,所述基于对比的损失函数用于使第一识别模型能够学习到不同类别样本的差异;若所述预设的损失函数为所述基于对比的损失函数,则所述训练样本对的标注结果包括用于指示所述训练样本对中的两个训练样本是否属于同一类别的第一标注结果;若所述预设的损失函数为由所述基于交叉熵的损失函数和所述基于对比的损失函数组成的损失函数,则所述训练样本对的标注结果包括用于指示所述训练样本对中的两个训练样本是否属于同一类别的第一标注结果,以及,用于指示所述训练样本对中两个训练样本分别所属类别的第二标注结果。5.根据权利要求2所述的识别模型的构建方法,其特征在于,所述第一识别模型、所述第二识别模型和所述第三识别模型中的任一识别模型包括:特征提取模块、特征规范化处理模块和分类模块;所述特征提取模块,用于从输入的训练样本或训练样本对中提取样本特征;所述特征规范化处理模块,用于对所述特征提取模块提取的样本特征进行规范化处理,以将所述特征提取模块提取的样本特征约束在高维空间的超球面上;所述分类模块,用于基于所述特征规范化处理模块进行规范化处理后的样本特征确定输入的训练样本或训练样本对所对应的识别结果。6.一种识别模型的构建装置,其特征在于,包括:样本集获取模块、第一训练模块、第一参数获取模块和第二训练模块;...

【专利技术属性】
技术研发人员:牟永奇
申请(专利权)人:北京朗镜科技有限责任公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1