图像内容物品定位方法及其装置、设备、介质、产品制造方法及图纸

技术编号:32533101 阅读:22 留言:0更新日期:2022-03-05 11:27
本申请公开一种图像内容物品定位方法及其装置、设备、介质、产品,所述方法包括:获取目标图像的特征图,特征图由多个平面点构成,每个平面点均为高维向量;计算两两平面点之间的相似度,以该相似度构造相似状态矩阵,使该相似状态矩阵中的元素表征其行坐标相对应的平面点与其列坐标相对应的平面点之间相似或不相似;以相似平面点的多寡由少至多预选多个平面点构成初步集合,在其中查找与具有最少相似平面点的种子平面点构成相似的平面点构成种子集;统计特征图中每个平面点与种子集中所有平面点的相似度的和值,当和值大于预设阈值时判定相应的平面点属于物品区域。本申请可以实现对目标图像中内容物品的有效定位,具有广泛通用性。通用性。通用性。

【技术实现步骤摘要】
图像内容物品定位方法及其装置、设备、介质、产品


[0001]本申请涉及图像识别
,尤其涉及一种图像内容物品定位方法及其相应的装置、计算机设备、计算机可读存储介质,以及计算机程序产品。

技术介绍

[0002]图像定位技术,是图像识别技术中的一项基础工作。现实中,大量的应用场景需要用到图像定位技术,包括人脸识别、物品识别等,通过从图片中识别出内容对象,可以裁剪出内容对象相应的图像,进一步可对内容对象的图像进行其他诸如图像检索、匹配、标注等工作。在人工智能技术迅速发展的背景下,还可用于为各种神经网络模型提供精准表达的内容对象图片,以供训练相应的神经网络模型。
[0003]示例性的电商应用领域中,商品的识别、商品的检索等相关图像识别技术都是非常重要的环节,对于商品的后续相关分析至关重要,而商品的定位是商品识别检索的首要环节。
[0004]目前的物品定位技术都需要大量的人工标注来训练定位模型,一方面,考虑到电商的商品品类数目非常庞大,对每一个品类的商品都进行商品人工定位标注是不现实的,相应的代价非常大。另一方面,与人脸图像存在明显的共有特征不同,电商领域中各式各样的商品图像形态各异,加上商品图像常受清晰度、拍摄视角、物体大小、背景噪声等影响而质量不均。
[0005]因此可见,多种原因导致现有广泛应用的各种定位模型的迁移能力及通用性较差,无法对未知商品进行有效定位。因而,有必要探索一种新型的图像定位技术来满足相关领域的需要。

技术实现思路

[0006]本申请的首要目的在于解决上述问题至少之一而提供一种图像内容物品定位方法及其相应的装置、计算机设备、计算机可读存储介质、计算机程序产品。
[0007]为满足本申请的各个目的,本申请采用如下技术方案:
[0008]适应本申请的目的之一而提供的一种图像内容物品定位方法,包括如下步骤:
[0009]获取表征目标图像的深层语义信息的特征图,所述特征图由多个平面点构成,每个平面点均为高维向量;
[0010]计算两两平面点之间的相似度,以该相似度构造相似状态矩阵,使该相似状态矩阵中的每个元素表征其行坐标相对应的平面点与其列坐标相对应的平面点之间相似或不相似;
[0011]以相似平面点的多寡由少至多预选多个平面点构成初步集合,在初步集合中查找与具有最少相似平面点的种子平面点构成相似的平面点构成种子集;
[0012]统计特征图中每个平面点与种子集中所有平面点的相似度的和值,当该和值大于预设阈值时,判定相应的平面点属于物品区域,获得该物品区域相应的图像。
[0013]深化的实施例中,获取表征目标图像的深层语义信息的特征图,包括如下步骤:
[0014]获取目标图像;
[0015]采用预训练的图像特征交互模型将目标图像切割为多个细分图像并分别提取图像特征向量;
[0016]采用所述图像特征交互模型将所述细分图像的图像特征向量进行特征交互,获得中间向量;
[0017]采用所述图像特征交互模型将所述中间向量归一化为特征图,使该特征图由多个平面点构成,每个平面点均为高维向量。
[0018]深化的实施例中,计算两两平面点之间的相似度,以该相似度构造相似状态矩阵,包括如下步骤:
[0019]计算所述特征图中两两平面点之间的相似度,构造出相应的相似数值矩阵,所述相似数值矩阵中,每个元素存储其行坐标相对应的平面点与其列坐标相对应的平面点之间相似度数值;
[0020]根据所述相似数值矩阵,构造出相应的相似状态矩阵,所述相似状态矩阵中的每个元素表征其行坐标相对应的平面点与其列坐标相对应的平面点之间相似或不相似。
[0021]较佳的实施例中,所述相似数值矩阵中的相似度数值被归一化为[

1,1]区间,所述相似状态矩阵中以数值1表示相似,以数值0表示不相似。
[0022]深化的实施例中,以相似平面点的多寡由少至多预选多个平面点构成初步集合,在初步集合中查找与具有最少相似平面点的种子平面点构成相似的平面点构成种子集,包括如下步骤:
[0023]根据所述相似状态矩阵,统计所述特征图中每个平面点的点相似总量,所述点相似总量表示与该平面点构成相似的平面点的总数量,获得由各个平面点的相似总构成的相似总量序列;
[0024]对所述相似总量序列进行逆向排序,以点相似总量由少至多预选出额定数量的多个平面点,构造为初步集合;
[0025]将该初步集合中点相似总量最小的平面点确定为种子点,从初步集合中选取与该种子点构成相似的所有平面点,构造为种子集。
[0026]深化的实施例中,统计特征图中每个平面点与种子集中所有平面点的相似度的和值,当该和值大于预设阈值时,判定相应的平面点属于物品区域,获得该物品区域相应的图像,包括如下步骤:
[0027]根据所述相似数值矩阵,统计特征图中每个平面点与种子集中所有平面点的相似度的和值;
[0028]判断该和值是否大于预设阈值,当该和值大于该预设阈值时,即确定相应的平面点属于物品区域;
[0029]根据所述物品区域从所述目标图像中提取相应的图像,作为内容物品图像。
[0030]具体化的实施例中,根据所述物品区域从所述目标图像中提取相应的图像,包括如下步骤:
[0031]针对每个物品区域,判断该物品区域是否与目标图像重叠,若不重叠则判定该物品区域有效,将该物品区域的平面点在特征图中的特征值清零后重启确定物品区域的全过
程进行迭代确定物品区域;
[0032]若当前物品区域与目标图像重叠,判定该物品区域无效,停止迭代确定物品区域;
[0033]根据被判定为有效的物品区域从所述目标图像中提取出相应的一个或多个内容物品图像。
[0034]适应本申请的目的之一而提供的一种图像内容物品定位装置,包括:图像转换模块、相似构造模块、邻域筛选模块,以及物品定位模块,其中,所述图像转换模块,用于获取表征目标图像的深层语义信息的特征图,所述特征图由多个平面点构成,每个平面点均为高维向量;所述相似构造模块,用于计算两两平面点之间的相似度,以该相似度构造相似状态矩阵,使该相似状态矩阵中的每个元素表征其行坐标相对应的平面点与其列坐标相对应的平面点之间相似或不相似;所述邻域筛选模块,用于以相似平面点的多寡由少至多预选多个平面点构成初步集合,在初步集合中查找与具有最少相似平面点的种子平面点构成相似的平面点构成种子集;所述物品定位模块,用于统计特征图中每个平面点与种子集中所有平面点的相似度的和值,当该和值大于预设阈值时,判定相应的平面点属于物品区域,获得该物品区域相应的图像。
[0035]深化的实施例中,所述图像转换模块,包括:图像获取子模块,用于获取目标图像;特征编码子模块,用于采用预训练的图像特征交互模型将目标图像切割为多个细分图像并分别提取图像特征向量;特征交互子模块,用于采用所述图像特征交互模型将所述细分图像的图像特征向量进行特征交互,获得中间向量;归一处理子模块,用于采用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像内容物品定位方法,其特征在于,包括如下步骤:获取表征目标图像的深层语义信息的特征图,所述特征图由多个平面点构成,每个平面点均为高维向量;计算两两平面点之间的相似度,以该相似度构造相似状态矩阵,使该相似状态矩阵中的每个元素表征其行坐标相对应的平面点与其列坐标相对应的平面点之间相似或不相似;以相似平面点的多寡由少至多预选多个平面点构成初步集合,在初步集合中查找与具有最少相似平面点的种子平面点构成相似的平面点构成种子集;统计特征图中每个平面点与种子集中所有平面点的相似度的和值,当该和值大于预设阈值时,判定相应的平面点属于物品区域,获得该物品区域相应的图像。2.根据权利要求1所述的图像内容物品定位方法,其特征在于,获取表征目标图像的深层语义信息的特征图,包括如下步骤:获取目标图像;采用预训练的图像特征交互模型将目标图像切割为多个细分图像并分别提取图像特征向量;采用所述图像特征交互模型将所述细分图像的图像特征向量进行特征交互,获得中间向量;采用所述图像特征交互模型将所述中间向量归一化为特征图,使该特征图由多个平面点构成,每个平面点均为高维向量。3.根据权利要求1所述的图像内容物品定位方法,其特征在于,计算两两平面点之间的相似度,以该相似度构造相似状态矩阵,包括如下步骤:计算所述特征图中两两平面点之间的相似度,构造出相应的相似数值矩阵,所述相似数值矩阵中,每个元素存储其行坐标相对应的平面点与其列坐标相对应的平面点之间相似度数值;根据所述相似数值矩阵,构造出相应的相似状态矩阵,所述相似状态矩阵中的每个元素表征其行坐标相对应的平面点与其列坐标相对应的平面点之间相似或不相似。4.根据权利要求3所述的图像内容物品定位方法,其特征在于,所述相似数值矩阵中的相似度数值被归一化为[

1,1]区间,所述相似状态矩阵中以数值1表示相似,以数值0表示不相似。5.根据权利要求1所述的图像内容物品定位方法,其特征在于,以相似平面点的多寡由少至多预选多个平面点构成初步集合,在初步集合中查找与具有最少相似平面点的种子平面点构成相似的平面点构成种子集,...

【专利技术属性】
技术研发人员:李保俊
申请(专利权)人:广州华多网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1