一种多元组样本构建方法及装置制造方法及图纸

技术编号:25044071 阅读:18 留言:0更新日期:2020-07-29 05:34
本发明专利技术实施例提供的一种多元组样本构建方法及装置,其中方法包括:获取由第一样本特征组成的第一特征集合;根据所述第一特征集合,获得预设的待训练模型当前次训练所需的第一多元组样本;通过所述待训练模型根据所述第一多元组样本进行前向计算获得第二样本特征;在所述第一特征集合中,将所述第一多元组样本所对应的第一样本特征更新为所述第二样本特征,获得第二特征集合;根据所述第二特征集合,获得所述待训练模型下一次训练时所需的第二多元组样本。本发明专利技术提高了多元组样本构建的质量,使用该方法构建的多元组样本可适应待训练模型不同阶段的学习,提高了待训练模型的收敛速度和效果。

【技术实现步骤摘要】
一种多元组样本构建方法及装置
本专利技术涉及机器学习与图像识别
,具体而言,涉及一种样本获取方法及装置。
技术介绍
在度量学习任务中,通常通过构造由相似图和不相似图组成的多元组来监督网络学习到图片之间的相似性。在多元组样本中分别包括了参考样本(anchor)、正样本(positive)和负样本(negative)。其中参考样本与正样本相似,而与负样本不像似。目前的多元组样本构建策略中,通常在一固定的样本训练集中对样本进行遍历计算完成,由于计算效率低,仅能在样本训练集的一小范围中构建多元组样本,这样构建的样本质量较低,无法有效的引导待训练模型不同阶段的学习。
技术实现思路
有鉴于此,本专利技术实施例的目的在于提供一种多元组样本构建方法及装置,本专利技术提高了多元组样本构建的质量;使用该方法构建的多元组样本可适应待训练模型不同阶段的学习,提高了待训练模型的收敛速度和效果。第一方面,本申请通过本申请的一实施例提供如下技术方案:一种多元组样本构建方法,包括:获取由第一样本特征组成的第一特征集合;根据所述第一特征集合,获得预设的待训练模型当前次训练所需的第一多元组样本;通过所述待训练模型,根据所述第一多元组样本进行前向计算,获得第二样本特征;在所述第一特征集合中,将所述第一多元组样本所对应的第一样本特征更新为所述第二样本特征,获得第二特征集合;根据所述第二特征集合,获得所述待训练模型下一次训练时所需的第二多元组样本。优选地,所述根据所述第一特征集合,获得预设的待训练模型当前次训练所需的第一多元组样本的步骤,包括:根据随机特征,从所述第一特征集合中抽取参考特征,并基于所述参考特征获得参考样本,其中,所述随机特征为从所述第一特征集合中随机选取获得,在所述第一特征集合中与所述参考特征相似的第一样本特征均被标记有识别标识;根据所述参考样本和标记有所述识别标识的第一样本特征,获得与所述参考样本对应的正样本;根据所述参考样本和未标记所述识别标识的第一样本特征,获得与所述参考样本对应的负样本;根据所述参考样本,与所述参考样本对应的正样本,以及与所述参考样本对应的负样本获得第一多元组样本,每个所述参考样本对应一个多元组样本。优选地,所述根据随机特征,从所述第一特征集合中抽取参考特征,并基于所述参考特征获得参考样本的步骤,包括:获取所述随机特征与每一个第一样本特征之间的第一相似度;当所述第一相似度属于预设的第一范围时,抽取属于所述第一范围的所述第一相似度对应的第一样本特征作为参考特征;将所述参考特征所对应的样本作为所述参考样本。优选地,所述根据所述参考样本和标记有所述识别标识的第一样本特征,获得与所述参考样本对应的正样本的步骤,包括:对同一个参考样本,获取所述参考样本对应的参考特征与标记有所述识别标识的第一样本特征之间的第二相似度;当所述第二相似度属于预设的第二范围时,抽取属于所述第二范围的所述第二相似度对应的第一样本特征,作为所述参考样本对应的正样本的特征;根据所述正样本的特征,获得该个参考样本对应的正样本。优选地,所述根据所述参考样本和未标记所述识别标识的第一样本特征,获得与所述参考样本对应的负样本的步骤,包括:对同一个参考样本,获取所述参考样本对应的参考特征与未标记有所述识别标识的第一样本特征的第三相似度;当所述第三相似度属于预设的第三范围时,抽取属于所述第三范围的所述第三相似度对应的第一样本特征,作为所述参考样本对应的负样本的特征;根据所述负样本的特征,获得该个参考样本对应的负样本。优选地,所述第一样本特征与所述第二样本特征均为图片的特征。第二方面,基于同一专利技术构思,本申请通过本申请的一实施例提供如下技术方案:一种多元组样本构建装置,包括:第一特征集合获取模块,用于获取由第一样本特征组成的第一特征集合;第一样本获取模块,用于根据所述第一特征集合,获得预设的待训练模型当前次训练所需的第一多元组样本;前向计算模块,用于通过所述待训练模型,根据所述第一多元组样本进行前向计算,获得第二样本特征;更新模块,用于在所述第一特征集合中,将所述第一多元组样本所对应的第一样本特征更新为所述第二样本特征,获得第二特征集合;第二样本获取模块,用于根据所述第二特征集合,获得所述待训练模型下一次训练时所需的第二多元组样本。优选地,所述第一样本获取模块,还用于:根据随机特征,从所述第一特征集合中抽取参考特征,并基于所述参考特征获得参考样本,其中,所述随机特征为从所述第一特征集合中随机选取获得,在所述第一特征集合中与所述参考特征相似的第一样本特征均被标记有识别标识;根据所述参考样本和标记有所述识别标识的第一样本特征,获得与所述参考样本对应的正样本;根据所述参考样本和未标记所述识别标识的第一样本特征,获得与所述参考样本对应的负样本;根据所述参考样本,与所述参考样本对应的正样本,以及与所述参考样本对应的负样本获得第一多元组样本,每个所述参考样本对应一个多元组样本。优选地,所述第一样本获取模块,还用于:获取所述随机特征与每一个第一样本特征之间的第一相似度;当所述第一相似度属于预设的第一范围时,抽取属于所述第一范围的所述第一相似度对应的第一样本特征作为参考特征;将所述参考特征所对应的样本作为所述参考样本。优选地,所述第一样本获取模块,还用于:对同一个参考样本,获取所述参考样本对应的参考特征与标记有所述识别标识的第一样本特征之间的第二相似度;当所述第二相似度属于预设的第二范围时,抽取属于所述第二范围的所述第二相似度对应的第一样本特征,作为所述参考样本对应的正样本的特征;根据所述正样本的特征,获得该个参考样本对应的正样本。优选地,所述第一样本获取模块,还用于:对同一个参考样本,获取所述参考样本对应的参考特征与未标记有所述识别标识的第一样本特征的第三相似度;当所述第三相似度属于预设的第三范围时,抽取属于所述第三范围的所述第三相似度对应的第一样本特征,作为所述参考样本对应的负样本的特征;根据所述负样本的特征,获得该个参考样本对应的负样本。优选地,所述第一样本特征与所述第二样本特征均为图片的特征。第三方面,基于同一专利技术构思,本申请通过本申请的一实施例提供如下技术方案:一种多元组样本构建装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:获取由第一样本特征组成的第一特征集合;根据所述第一特征集合,获得预设的待训练模型当前次训练所需的第一多元组样本;通过所述待训练模型,根据所述第一多元组样本进行前向计算,获得第二样本特征;在所述第一特征集合中,将所述第一多元组样本所对应的第一样本特征更新为所述第二样本特征,获得第二特征集合;根据所述第二特征集合,获得所述待训练模型下一次训练时所需的第二多元组样本。第四方面,基于同一专利技术构思,本申请通过本申请的一实施例提供本文档来自技高网...

【技术保护点】
1.一种多元组样本构建方法,其特征在于,包括:/n获取由第一样本特征组成的第一特征集合;/n根据所述第一特征集合,获得预设的待训练模型当前次训练所需的第一多元组样本;/n通过所述待训练模型,根据所述第一多元组样本进行前向计算,获得第二样本特征;/n在所述第一特征集合中,将所述第一多元组样本所对应的第一样本特征更新为所述第二样本特征,获得第二特征集合;/n根据所述第二特征集合,获得所述待训练模型下一次训练时所需的第二多元组样本。/n

【技术特征摘要】
1.一种多元组样本构建方法,其特征在于,包括:
获取由第一样本特征组成的第一特征集合;
根据所述第一特征集合,获得预设的待训练模型当前次训练所需的第一多元组样本;
通过所述待训练模型,根据所述第一多元组样本进行前向计算,获得第二样本特征;
在所述第一特征集合中,将所述第一多元组样本所对应的第一样本特征更新为所述第二样本特征,获得第二特征集合;
根据所述第二特征集合,获得所述待训练模型下一次训练时所需的第二多元组样本。


2.根据权利要求1所述的方法,其特征在于,所述根据所述第一特征集合,获得预设的待训练模型当前次训练所需的第一多元组样本的步骤,包括:
根据随机特征,从所述第一特征集合中抽取参考特征,并基于所述参考特征获得参考样本,其中,所述随机特征为从所述第一特征集合中随机选取获得,在所述第一特征集合中与所述参考特征相似的第一样本特征均被标记有识别标识;
根据所述参考样本和标记有所述识别标识的第一样本特征,获得与所述参考样本对应的正样本;
根据所述参考样本和未标记所述识别标识的第一样本特征,获得与所述参考样本对应的负样本;
根据所述参考样本,与所述参考样本对应的正样本,以及与所述参考样本对应的负样本获得第一多元组样本,每个所述参考样本对应一个多元组样本。


3.根据权利要求2所述的方法,其特征在于,所述根据随机特征,从所述第一特征集合中抽取参考特征,并基于所述参考特征获得参考样本的步骤,包括:
获取所述随机特征与每一个第一样本特征之间的第一相似度;
当所述第一相似度属于预设的第一范围时,抽取属于所述第一范围的所述第一相似度对应的第一样本特征作为参考特征;
将所述参考特征所对应的样本作为所述参考样本。


4.根据权利要求3所述的方法,其特征在于,所述根据所述参考样本和标记有所述识别标识的第一样本特征,获得与所述参考样本对应的正样本的步骤,包括:
对同一个参考样本,获取所述参考样本对应的参考特征与标记有所述识别标识的第一样本特征之间的第二相似度;
当所述第二相似度属于预设的第二范围时,抽取属于所述第二范围的所述第二相似度对应的第一样本特征,作为所述参考样本对应的正样本的特征;
根据所述正样本的特征,获得该个参考样本对应的正样本。


5.根据权利要求3所述的方法,其特征在于,所述根据所述参考样本和未标记所述识别标识的第一样本特征,获得与所述参考样本对应的负样本的步骤,包括:
对同一个参考样本,获取所述参考样本对应的参考特征与未标记有所述识别标识的第一样本特征的第三相似度;
当所述第三相似度属于预设的第三范围时,抽取属于所述第三范围的所述第三相似度对应的第一样本特征,作为所述参考样本对应的负样本的特征;
根据所述负样本的特征,获得该...

【专利技术属性】
技术研发人员:夏雄尉谢泽华周泽南苏雪峰许静芳
申请(专利权)人:搜狗杭州智能科技有限公司北京搜狗科技发展有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1