数据处理方法、装置及设备制造方法及图纸

技术编号:32834062 阅读:14 留言:0更新日期:2022-03-26 20:51
本说明书实施例提供了一种数据处理方法、装置及设备,所述方法包括:在接收到针对第一图像的相似图像检索指令的情况下,确定与所述第一图像对应的候选图像;基于预先训练的特征提取模型,获取与所述第一图像对应的第一特征向量,与所述候选图像对应的第二特征向量,所述特征提取模型为基于第二图像、所述第二图像的标签,对由特征提取算法和度量学习算法构建的特征提取模型进行训练得到,所述第二图像的标签为基于所述第二图像的标题信息和预设聚类算法确定;基于所述第一特征向量和所述第二特征向量,确定所述候选图像中与所述第一图像对应的目标图像,并将所述目标图像确定为与所述相似图形检索指令对应的检索结果。述相似图形检索指令对应的检索结果。述相似图形检索指令对应的检索结果。

【技术实现步骤摘要】
数据处理方法、装置及设备


[0001]本文件涉及数据处理
,尤其涉及一种数据处理方法、装置及设备。

技术介绍

[0002]随着互联网行业的迅速发展,应用服务商可以为用户提供的业务服务越来越多样化,用户可以使用的业务也越来越多。
[0003]例如,用户在购物平台上,可以通过带有某商品的图像,对该商品进行检索,其中,购物平台的服务器在接收到该检索图像后,可以获取每个存储图像与该检索图像之间的图像相似度,并将图像相似度较高的存储图像对应的商品作为检索结果返回给用户。但是,由于商品的种类越来越多,商品与商品之间的差异越来越小,仅通过图像相似度进行商品的检索,检索准确性低,无法满足用户的检索需求。因此,需要一种提高通过图像进行检索时的检索准确性的解决方案。

技术实现思路

[0004]本说明书实施例的目的是提供一种数据处理方法、装置及设备,以提供一种能够提高通过图像进行检索时的检索准确性的解决方案。
[0005]为了实现上述技术方案,本说明书实施例是这样实现的:
[0006]第一方面,本说明书实施例提供了一种数据处理方法,包括:在接收到针对第一图像的相似图像检索指令的情况下,确定与所述第一图像对应的候选图像;基于预先训练的特征提取模型,获取与所述第一图像对应的第一特征向量,与所述候选图像对应的第二特征向量,所述特征提取模型为基于第二图像、所述第二图像的标签,对由特征提取算法和度量学习算法构建的特征提取模型进行训练得到,所述第二图像的标签为基于所述第二图像的标题信息和预设聚类算法确定;基于所述第一特征向量和所述第二特征向量,确定所述候选图像中与所述第一图像对应的目标图像,并将所述目标图像确定为与所述相似图形检索指令对应的检索结果。
[0007]第二方面,本说明书实施例提供了一种数据处理方法,应用于区块链系统,包括:在接收到针对第一图像的相似图像检索指令的情况下,基于预先部署在所述区块链系统中的第一智能合约,获取与所述第一图像对应的候选图像;基于所述第一智能合约和预先训练的特征提取模型,获取与所述第一图像对应的第一特征向量,与所述候选图像对应的第二特征向量,所述特征提取模型为基于第二图像、所述第二图像的标签,对由特征提取算法和度量学习算法构建的特征提取模型进行训练得到,所述第二图像的标签为基于所述第二图像的标题信息和预设聚类算法确定;基于所述第一智能合约、所述第一特征向量和所述第二特征向量,确定所述候选图像中与所述第一图像对应的目标图像,并将所述目标图像确定为与所述相似图形检索指令对应的检索结果。
[0008]第三方面,本说明书实施例提供了一种数据处理装置,所述装置包括:图像选取模块,用于在接收到针对第一图像的相似图像检索指令的情况下,确定与所述第一图像对应
的候选图像;向量获取模块,用于基于预先训练的特征提取模型,获取与所述第一图像对应的第一特征向量,与所述候选图像对应的第二特征向量,所述特征提取模型为基于第二图像、所述第二图像的标签,对由特征提取算法和度量学习算法构建的特征提取模型进行训练得到,所述第二图像的标签为基于所述第二图像的标题信息和预设聚类算法确定;图像确定模块,用于基于所述第一特征向量和所述第二特征向量,确定所述候选图像中与所述第一图像对应的目标图像,并将所述目标图像确定为与所述相似图形检索指令对应的检索结果。
[0009]第四方面,本说明书实施例提供了一种数据处理装置,所述装置为区块链系统中的装置,包括:图像选取模块,用于在接收到针对第一图像的相似图像检索指令的情况下,基于预先部署在所述区块链系统中的第一智能合约,获取与所述第一图像对应的候选图像;向量获取模块,用于基于所述第一智能合约和预先训练的特征提取模型,获取与所述第一图像对应的第一特征向量,与所述候选图像对应的第二特征向量,所述特征提取模型为基于第二图像、所述第二图像的标签,对由特征提取算法和度量学习算法构建的特征提取模型进行训练得到,所述第二图像的标签为基于所述第二图像的标题信息和预设聚类算法确定;图像确定模块,用于基于所述第一智能合约、所述第一特征向量和所述第二特征向量,确定所述候选图像中与所述第一图像对应的目标图像,并将所述目标图像确定为与所述相似图形检索指令对应的检索结果。
[0010]第五方面,本说明书实施例提供了一种数据处理设备,所述数据处理设备为区块链系统中的设备,所述数据处理设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:在接收到针对第一图像的相似图像检索指令的情况下,确定与所述第一图像对应的候选图像;基于预先训练的特征提取模型,获取与所述第一图像对应的第一特征向量,与所述候选图像对应的第二特征向量,所述特征提取模型为基于第二图像、所述第二图像的标签,对由特征提取算法和度量学习算法构建的特征提取模型进行训练得到,所述第二图像的标签为基于所述第二图像的标题信息和预设聚类算法确定;基于所述第一特征向量和所述第二特征向量,确定所述候选图像中与所述第一图像对应的目标图像,并将所述目标图像确定为与所述相似图形检索指令对应的检索结果。
[0011]第六方面,本说明书实施例提供了一种数据处理设备,所述数据处理设备为区块链系统中的设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:在接收到目标用户针对第一业务的执行指令的情况下,基于预先部署在所述区块链系统中的第三智能合约,获取与所述第一业务对应的身份验证页面,所述身份验证页面用于对所述目标用户触发执行所述第一业务进行身份验证;基于所述第三智能合约,获取与所述第一业务匹配的身份感提示信息,并基于所述第三智能合约、所述身份感提示信息和所述身份验证页面,生成针对所述目标用户的且携带有所述身份感提示信息的目标验证页面;将所述目标验证页面提供给所述目标用户的设备,并基于所述第三智能合约从所述目标用户的设备获取所述目标用户在所述目标验证页面输入的第一身份验证信息;基于所述第三智能合约和所述第一身份验证信息,对所述目标用户触发执行所述第一业务进行身份验证,并在身份验证通过的情况下,执行所述第一业务。
[0012]第七方面,本说明书实施例提供一种存储介质,所述存储介质用于存储计算机可
执行指令,所述可执行指令在被执行时实现以下流程:在接收到目标用户针对第一业务的执行指令的情况下,获取与所述第一业务对应的身份验证页面,所述身份验证页面用于对所述目标用户触发执行所述第一业务进行身份验证;获取与所述第一业务匹配的身份感提示信息,并基于所述身份感提示信息和所述身份验证页面,生成针对所述目标用户的且携带有所述身份感提示信息的目标验证页面;接收所述目标用户在所述目标验证页面输入的第一身份验证信息,并基于所述第一身份验证信息对所述目标用户触发执行所述第一业务进行身份验证;如果身份验证通过,则执行所述第一业务。
[0013]第八方面,本说明书实施例提供一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被处理器执行时实现以下流程:在接收到针对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,包括:在接收到针对第一图像的相似图像检索指令的情况下,确定与所述第一图像对应的候选图像;基于预先训练的特征提取模型,获取与所述第一图像对应的第一特征向量,与所述候选图像对应的第二特征向量,所述特征提取模型为基于第二图像、所述第二图像的标签,对由特征提取算法和度量学习算法构建的特征提取模型进行训练得到,所述第二图像的标签为基于所述第二图像的标题信息和预设聚类算法确定;基于所述第一特征向量和所述第二特征向量,确定所述候选图像中与所述第一图像对应的目标图像,并将所述目标图像确定为与所述相似图形检索指令对应的检索结果。2.根据权利要求1所述的方法,所述基于所述第一特征向量和所述第二特征向量,确定所述候选图像中与所述第一图像对应的目标图像,包括:基于所述第一特征向量和所述第二特征向量,确定每个所述候选图像与所述第一图像之间的图像相似度;基于每个所述候选图像与所述第一图像之间的图像相似度,确定所述候选图像中与所述第一图像对应的目标图像。3.根据权利要求2所述的方法,所述基于每个所述候选图像与所述第一图像之间的图像相似度,确定所述候选图像中与所述第一图像对应的目标图像,包括:将所述候选图像中图像相似度大于预设相似度阈值的候选图像,确定为目标候选图像;基于所述目标候选图像对应的第二特征向量和所述第一特征向量,对所述第一特征向量进行更新处理,得到更新处理后的第一特征向量;基于所述更新处理后的第一特征向量和所述候选图像对应的第二特征向量,确定所述候选图像中与所述第一图像对应的目标图像。4.根据权利要求3所述的方法,所述目标候选图像为多个,所述基于所述目标候选图像对应的第二特征向量和所述第一特征向量,对所述第一特征向量进行更新处理,得到更新处理后的第一特征向量,包括:获取所述多个目标候选图像对应的第二特征向量的第一均值,并将第一均值与所述第一特征向量的均值,确定为所述更新处理后的第一特征向量。5.根据权利要求4所述的方法,在所述基于预先训练的特征提取模型,获取与所述第一图像对应的第一特征向量,与所述候选图像对应的第二特征向量之前,还包括:获取所述第二图像的标题信息;基于预先构建的词库和所述第二图像的标题信息,确定与所述第二图像对应的第一向量;基于所述第一向量和所述预设聚类算法,对所述第二图像进行聚类处理,得到多个类别;基于所述第二图像对应的类别,确定所述第二图像的标签;基于所述第二图像、所述第二图像的标签,对所述由特征提取算法和度量学习算法构建的特征提取模型进行训练,得到所述预先训练的特征提取模型。6.根据权利要求5所述的方法,所述基于预先构建的词库和所述第二图像的标题信息,
确定与所述第二图像对应的第一向量,包括:基于所述预先构建的词库中包含的每个词,在每个所述第二图像的标题信息中的数量,确定每个所述第二图像对应的数量向量;基于所述预先构建的词库中包含的每个词,在每个所述第二图像的标题信息中的位置信息,确定每个所述第二图像对应的位置向量;基于所述第二图像的标题信息,确定所述预先构建的词库中包含的每个词的分类熵,并根据所述预先构建的词库中包含的每个词的分类熵和每个所述第二图像的标题信息,确定每个所述第二图像对应的熵向量;基于所述预先构建的词库中包含的每个词,在每个所述第二图像的标题信息中出现的次数,以及在其他所述第二图像的标题信息中出现的次数,确定每个所述第二图像对应的词频向量;基于所述数量向量、所述位置向量、所述熵向量和所述词频向量,确定所述第二图像对应的第一向量。7.根据权利要求6所述的方法,所述基于所述第二图像、所述第二图像的标签,对所述由特征提取算法和度量学习算法构建的特征提取模型进行训练,得到所述预先训练的特征提取模型,包括:将目标类别对应的第二图像确定为第三图像,所述目标类别对应的第二图像的数量大于预设数量阈值;基于所述第三图像、所述第三图像的标签,对所述由特征提取算法和度量学习算法构建的特征提取模型进行训练,得到所述预先训练的特征提取模型。8.根据权利要求7所述的方法,所述基于所述第三图像、所述第三图像的标签,对所述由特征提取算法和度量学习算法构建的特征提取模型进行训练,得到所述预先训练的特征提取模型,包括:基于所述目标类别对应的第三图像的个数,确定与所述目标类别对应的类别权重;基于所述第三图像的标签,确定所述第三图像对应的目标类别,并将所述目标类别对应的类别权重,确定为所述第三图像对应的类别权重;基于所述第三图像、所述第三图像对应的类别权重,对所述由特征提取算法和度量学习算法构建的特征提取模型进行训练,得到所述预先训练的特征提取模型,所述第三图像对应的类别权重用于在模型训练过程中,确定所述第三图像对应的交叉熵损失,以基于所述交叉熵损失对所述特征提取模型进行训练。9.根据权利要求8所述的方法,所述特征提取模型包含特征提取层和嵌入层,所述特征提取层用于提取所述第三图像的图像特征,所述嵌入层用于将所述图像特征转换为预定维数的特征向量,所述特征提取模型的损失函数为包含带权重的交叉熵损失的人脸识别损失函数。10.一种数据处理方法,应用于区块链系统,包括:在接收到针对第一图像的相似图像检索指令的情况下,基于预先部署在所述区块链系统中的第一智能合约,获取与所述第一图像对应的候选图像;基于所述第一智能合约和预先训练的特征提取模型,获取与所述第一图像对应的第一特征向量,与所述候选图像对应的第二特征向量,所述特征提取模型为基于第二图像、所述
第二图像的标签,对由特征提取算法和度量学习算法构建的特征提取模型进行训练得到,所述第二图像的标签为基于所述第二图像的标题信息和预设聚类算法确定;基于所述第一智能合约、所述第一特征向量和所述第二特征向量,确定所述候选图像中与所述第一图像对应的目标图像,并将所述目标图像确定为与所述相似图形检索指令对应的检索结果。11.根据权利...

【专利技术属性】
技术研发人员:兰钧应缜哲孟昌华王维强
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1