【技术实现步骤摘要】
对象信息处理方法、装置、设备和介质
[0001]本申请涉及人工智能领域,特别是涉及一种对象信息处理方法、装置、设备和介质。
技术介绍
[0002]哈希码是一种算法,其让对象信息按照自己的特征生成不同的哈希码。可以理解,哈希码是一段数据唯一、且极其紧凑的数值表示形式。随着计算机技术的发展,将对象信息生成相应的哈希码可应用于日常生活中的很多业务领域。因此,将对象信息生成准确的哈希码具有广泛的应用价值。
[0003]通常情况下,是使用训练的哈希生成模型生成对象信息的哈希码。然而,传统方法在训练哈希生成模型的过程中,指导模型优化训练的损失值仅考虑了当前批次中的样本数据。这样一来,如果分批次训练模型,则在先批次的优化结果容易被破坏,模型训练过程中数据容易发生震荡,从而导致训练得到的哈希生成模型的性能较差,从而导致对象信息的哈希码生成准确率低。
技术实现思路
[0004]基于此,有必要针对上述技术问题,提供一种能够提升哈希码生成准确率的对象信息处理方法、装置、设备和介质。
[0005]第一方面,本申请提供 ...
【技术保护点】
【技术特征摘要】
1.一种对象信息处理方法,其特征在于,所述方法包括:获取样本集;所述样本集中各样本对象信息携带有标签;确定任意两个样本对象信息对应的标签的相似度与哈希相似度的差异,得到第一损失值;所述哈希相似度是待训练的哈希生成模型针对所述任意两个样本对象信息生成的哈希码之间的相似度;针对所述样本集中的每个目标样本对象信息,确定所述目标样本对象信息与所述样本集中相似的样本对象信息之间的第一哈希相似度;确定所述目标样本对象信息与所述样本集中不相似的样本对象信息之间的第二哈希相似度;根据所述样本集中各所述目标样本对象信息分别对应的所述第一哈希相似度和所述第二哈希相似度,确定第二损失值;根据所述第一损失值和所述第二损失值,对所述待训练的哈希生成模型进行训练,得到已训练的哈希生成模型;所述已训练的哈希生成模型用于针对输入的目标对象信息生成相应的哈希码。2.根据权利要求1所述的方法,其特征在于,所述根据所述样本集中各所述目标样本对象信息分别对应的所述第一哈希相似度和所述第二哈希相似度,确定第二损失值,包括:针对所述样本集中的每个目标样本对象信息,根据所述目标样本对象信息对应的所述第一哈希相似度和所述第二哈希相似度,确定全局哈希相似度;根据所述第一哈希相似度与所述全局哈希相似度的比值,确定所述目标样本对象信息对应的相似占比参数;根据所述样本集中各所述目标样本对象信息分别对应的相似占比参数,确定第二损失值。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:针对所述样本集中的每个目标样本对象信息,将所述样本集中与所述目标样本对象信息具有至少一个相同标签的样本对象信息作为与所述目标样本对象信息相似的样本对象信息;将所述样本集中未与所述目标样本对象信息具有相同标签的样本对象信息作为与所述目标样本对象信息不相似的样本对象信息。4.根据权利要求1所述的方法,其特征在于,所述确定所述目标样本对象信息与所述样本集中相似的样本对象信息之间的第一哈希相似度,包括:根据第一哈希码与第二哈希码之间的相似度,得到第一哈希相似度;所述第一哈希码,是所述待训练的哈希生成模型针对所述目标样本对象信息生成的哈希码;所述第二哈希码,是所述待训练的哈希生成模型针对所述样本集中与所述目标样本对象信息相似的样本对象信息生成的哈希码;所述确定所述目标样本对象信息与所述样本集中不相似的样本对象信息之间的第二哈希相似度,包括:根据所述第一哈希码与第三哈希码之间的相似度,得到第二哈希相似度;所述第三哈希码,是所述待训练的哈希生成模型针对所述样本集中与所述目标样本对象信息不相似的样本对象信息生成的哈希码。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述目标对象信息输入至所述已训练的哈希生成模型,以通过所述已训练的哈希生成模型提取所述目标对象信息的对象信息特征;将所述对象信息特征中的各特征字段分别进行哈希编码,得到各所述特征字段分别对应的哈希位;将各所述特征字段分别对应的哈希位进行级联,得到所述目标对象信息的哈希码。6.根据权利要求5所述的方法,其特征在于,所述目标对象信息是包括在至少两种模态下的对象信息的信息组;所述将所述目标对象信息输入至所述已训练的哈希生成模型,以通过所述已训练的哈希生成模型提取所述目标对象信息的对象信息特征,包括:将所述目标对象信息中各模态下的对象信息输入至所述已训练的哈希生成模型,以通过所述已训练的哈希生成模型提取各所述模态下的对象信息的信息子特征;将同一所述目标对象信息中各模态下的对象信息分别对应的信息子特征进行融合,得到所述目标对象信息的对象信息特征。7.根据权利要求6所述的方法,其特征在于,所述目标对象信息中包括在图像模态下的对象图像信息和在文本模态下的对象文本信息;所述信息子特征包括针对所述对象图像信息提取得到的对象图像特征,以及针对所述对象文本信息提取得到的对象文本特征;所述将同一所述目标对象信息中各模态下的对象信息分别对应的信息子特征进行融合,得到所述目标对象信息的对象信息特征,包括:将同一所述目标对象信息对应的所述对象图像特征和所述对象文本特征进行融合,得到所述目标对象信息的对象信息特征。8.根据权利要求7所述的方法,其特征在于,所述将同一所述目标对象信息对应的所述对象图像特征和所述对象文本特征进行融合,得到所述目标对象信息的对象信息特征...
【专利技术属性】
技术研发人员:蔡成飞,涂荣成,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。