基于特征选择性聚合的大规模图片侵权检测方法及系统技术方案

技术编号：33629150 阅读：7 留言：0更新日期：2022-06-02 01:29

本发明专利技术提出了一种基于特征选择性聚合的大规模图片侵权检测方法及系统，属于图片侵权检测领域。该方法利用在大规模图片数据集上预训练的深度残差卷积神经网络提取图片的高层语义特征图，利用选择性特征聚合算法SCDA对特征图进行有选择地聚合，并使用主成分分析方法PCA将聚合得到的特征压缩为一个低维稠密特征向量表示，利用乘积量化的方式为特征向量构建索引，以实现大规模图片侵权检测。这种方法效率很高，可以实现在百万级别向量中毫秒级查找。找。找。

全部详细技术资料下载

【技术实现步骤摘要】
Descriptor Aggregation)对特征图进行有选择地聚合，并使用主成分分析方法PCA(Principal components analysis)将聚合得到的特征压缩为一个低维稠密特征向量表示，利用乘积量化(Product quantization)的方式为特征向量构建索引，以实现大规模图片侵权检测。
[0009]为了实现上述目的，本专利技术提供了如下技术方案：
[0010]本专利技术的其中一个目的在于提供一种基于特征选择性聚合的大规模图片侵权检测方法，包括以下步骤：
[0011]1)图片预处理：将数据库图片缩放至预设尺寸，并进行图片标准化处理；
[0012]2)提取预处理后的图片的高层语义特征，得到高层语义特征图；
[0013]3)对高层语义特征图按通道进行求和，得到求和结果大于阈值的最大连通区域；将最大连通区域中的特征向量进行加总聚合，得到聚合特征向量；
[0014]4)对聚合特征向量进行PCA主成分分析和降维处理，并对降维后的聚合特征向量进行标准化处理，得到降维后的标准化聚合特征向量；
[0015]5)针对所有的数据库图片对应的降维后的标准化聚合特征向量，采用乘积量化的方式建立索引；
[0016]6)针对每张待查询图片，根据步骤1)至步骤4)的方法获得待查询图片的降维后的标准化聚合特征向量，并通过索引查找数据库中与其最相近的图片，如果相似度超过某一阈值，则判定其为侵权图片。
[0017]本专利技术的另一个目的在于提供一种基于上述方法的特征选择性聚合的大规模图片侵权检测...

【技术保护点】

【技术特征摘要】
1.一种基于特征选择性聚合的大规模图片侵权检测方法，其特征在于，包括以下步骤：1)图片预处理：将数据库图片缩放至预设尺寸，并进行图片标准化处理；2)提取预处理后的图片的高层语义特征，得到高层语义特征图；3)对高层语义特征图按通道进行求和，得到求和结果大于阈值的最大连通区域；将最大连通区域中的特征向量进行加总聚合，得到聚合特征向量；4)对聚合特征向量进行PCA主成分分析和降维处理，并对降维后的聚合特征向量进行标准化处理，得到降维后的标准化聚合特征向量；5)针对所有的数据库图片对应的降维后的标准化聚合特征向量，采用乘积量化的方式建立索引；6)针对每张待查询图片，根据步骤1)至步骤4)的方法获得待查询图片的降维后的标准化聚合特征向量，并通过索引查找数据库中与其最相近的图片，如果相似度超过某一阈值，则判定其为侵权图片。2.根据权利要求1所述的基于特征选择性聚合的大规模图片侵权检测方法，其特征在于，所述的图片标准化处理方式为：对每张图片的每个通道都执行：image
*
＝(image
‑
mean)/std式中，image
*
为预处理后的通道像素值，image为预处理前的通道像素值，mean和std分别为通道的均值和方差。3.根据权利要求1所述的基于特征选择性聚合的大规模图片侵权检测方法，其特征在于，所述的步骤2)采用4层的深度残差卷积神经网络ResNet来提取图片的高层语义特征，将ResNet最后一层的输出作为最终结果。4.根据权利要求1所述的基于特征选择性聚合的大规模图片侵权检测方法，其特征在于，所述的步骤3)具体为：3.1)将高层语义特征图表示为一个(a，b，m)的张量，其中a和b表示特征图的长度和宽度，m表示通道数，即特征图的维度；3.2)以(i，j，k)表示特征图中的第i行第j列第k个通道的数值，对该特征图按通道进行相加，得到聚合特征矩阵A＝{A
i，j
}，1≤i≤a，1≤j≤b，A
i，j
表示矩阵A中第i行第j列的元素；且：3.3)根据聚合特征矩阵A建立二维掩膜矩阵M，且：式中，M
i，j
是掩膜矩阵中第i行第j列的元素，为预设的掩膜阈值；3.4)获取二维掩膜矩阵M中数值为1的最大连通区域，将高层语义特征图中每一个通道上的所述最大连通区域部分加总聚合起来，得到m维的聚合特征向量，即聚合特征向量。5.根据权利要求1所述的基于特征选择性聚合的大规模图片侵权检测方法，其特征在于，所述的步骤4)具体为：4.1)对所有的数据库图片对应的聚合特征向量进行中心化，即：
式中，x
i*
表示中心化后的第i张数据库图片的聚合特征向量，n表示数据库图片的总数，x
i
和x
j
分别是中心化前的第i张数据库图片和第j张数据库图片的聚合特征向量；4.2)计算(x
1*
，x
2*
，...，x
i*
，...，x
n*
)的协方差矩阵，并对其进行特征值分解，取出最大的k个特征值对应的特征向量(w1，w2，...，w
k
)，并对其进行标准化后得到特征向量矩阵W，对每一个原始向量x
i
转换为y
i
＝W
T
x
i
，得到维度为k的一组降维后的聚合特征向量Y＝(y1，y2，...，y
n
)，4.3)对降维后的每一个聚合特征向量y
i
进行标准化处理：式中，表示标准化之前的第i个图片降维后的聚合特征向量中的第p个元素，表示标准化之后的第i个图片降维后的聚合特征向量中的第p个元素；每一张图片对应的降维后的标准化聚合特征向量表示为6.根据权利要求1所述的基于特征选择性聚合的大规模图片侵权检测方法，其特征在于，所述的步骤5)具体为：针对所有的数据库图片对应的降维后的标准化聚合特征向量，采用乘积量化的方式建立索引；5.1)针对所有的数据库图片对应的降维后的标准化聚合特征向量(y
1*
，y
2*
，...，y
n*
)，利用K
‑
Means聚类算法聚成K类，得到K个第一聚类中心；其中，y
i*
表示第i张图片对应的降维后的标准化聚合特征向量，n表示数据库图片的总数；5.2)针对每一个数据库图片对应的降维后的标准化聚合特征向量y
i*
，其对应的第一聚类中心向量为c
i
，将其相减得到残差向量(y
i*
‑

【专利技术属性】
技术研发人员：陈建海，鲍科，阮汉宁，何钦铭，
申请(专利权)人：浙江阿蚂科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人