一种用户可扩展的标签标注方法及系统技术方案

技术编号：13999982 阅读：56 留言：0更新日期：2016-11-15 14:08

本发明专利技术公开一种用户可扩展的标签标注方法及系统，包括步骤步骤S1：对用户采样获取用户样本数据并标记用户的样本图片，生成样本用户标签标注矩阵；步骤S2：通过卷积神经网络对用户样本数据预处理，生成用户兴趣特征矩阵和标签兴趣特征矩阵；步骤S3：利用样本用户标签标注矩阵、用户兴趣特征矩阵和标签兴趣特征矩阵计算并生成用户标签关联知识数据；步骤S4：通过用户标签关联知识数据，计算生成用户新标签标注数据。本发明专利技术解决在对用户进行图像数据标签化处理过程中，如何合理地、低成本地完成对用户进行新的标签标注的问题，本发明专利技术有效地提升了在对用户进行新的标签化的过程中的计算效率和数据利用效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于图像处理
，特别是涉及一种用户可扩展的标签标注方法及系统。
技术介绍
目前大数据技术和商业智能技术正在飞速发展，互联网用户每天正在飞速地产生大量数据，这些数据中包含了结构化数据和非结构化数据，其中图片数据就是非结构化数据中占比极大的一块。基于用户的图像数据，挖掘用户的潜在兴趣点，在商业智能领域的需求已经非常巨大，伴随而生的深度学习、神经网络等技术也正日趋成熟商用。但这些技术的应用往往需要大量的GPU高昂硬件设备成本的付出，在对这些图片数据进一步进行处理的时候，会对同一张图片进行重复的GPU计算处理，消耗了大量不必要的计算资源，从而产生了极大的资源浪费。
技术实现思路
为了解决上述问题，本专利技术提出了一种用户可扩展的标签标注方法及系统，解决在对用户进行图像数据标签化处理过程中，如何合理地、低成本地完成对用户进行新的标签标注的问题，本专利技术有效地提升了在对用户进行新的标签化的过程中的计算效率和数据利用效率。为达到上述目的，本专利技术采用的技术方案是：一种用户可扩展的标签标注方法，步骤包括：步骤S1：对用户采样获取用户样本数据，并标记用户的样本图片，生成样本用户标签标注矩阵；步骤S2：通过卷积神经网络对用户样本数据预处理，生成用户兴趣特征矩阵和标签兴趣特征矩阵；步骤S3：利用样本用户标签标注矩阵、用户兴趣特征矩阵和标签兴趣特征矩阵计算并生成用户标签关联知识数据；步骤S4：通过用户标签关联知识数据，计算生成用户新标签标注数据。进一步的是，所述步骤S1包括步骤：对用户进行随机采样作为用户样本数据，标记用户收藏的图片作为样本图片；对样本图片进行标...

【技术保护点】
一种用户可扩展的标签标注方法，其特征在于，步骤包括；步骤S1：对用户采样获取用户样本数据，并标记用户的样本图片，生成样本用户标签标注矩阵；步骤S2：通过卷积神经网络对用户样本数据预处理，生成用户兴趣特征矩阵和标签兴趣特征矩阵；步骤S3：利用样本用户标签标注矩阵、用户兴趣特征矩阵和标签兴趣特征矩阵计算并生成用户标签关联知识数据；步骤S4：通过用户标签关联知识数据，计算生成用户新标签标注数据。

【技术特征摘要】
1.一种用户可扩展的标签标注方法，其特征在于，步骤包括；步骤S1：对用户采样获取用户样本数据，并标记用户的样本图片，生成样本用户标签标注矩阵；步骤S2：通过卷积神经网络对用户样本数据预处理，生成用户兴趣特征矩阵和标签兴趣特征矩阵；步骤S3：利用样本用户标签标注矩阵、用户兴趣特征矩阵和标签兴趣特征矩阵计算并生成用户标签关联知识数据；步骤S4：通过用户标签关联知识数据，计算生成用户新标签标注数据。2.根据权利要求1所述的一种用户可扩展的标签标注方法，其特征在于，所述步骤S1包括步骤：对用户进行随机采样作为用户样本数据，标记用户收藏的图片作为样本图片；对样本图片进行标签标记，其中每张图片有多个标签标记或只有一个标签标记；利用用户样本数据和样本图片的标签标记生成样本用户的标签标注矩阵，其中第j个用户的标签特征向量由标记的图片标签归一化分布产生。3.根据权利要求2所述的一种用户可扩展的标签标注方法，其特征在于，所述步骤S2包括步骤：将每个用户样本数据作为卷积神经网络的输入数据，获取分类特征层的数值输出特征，每张图片输出一个固定维度的特征；将带有标签标注的样本图片依据用户进行归类，作为训练数据输入；综合归一化每个用户样本的特征维度，根据训练数据生成用户兴趣特征矩阵；将样本图片依据标签进行归类，作为训练数据输入；将生成的图片特征作为矩阵的横向量，构建图像特征矩阵；综合归一化每个标签样本的特征维度，生成标签兴趣特征矩阵。4.根据权利要求3所述的一种用户可扩展的标签标注方法，其特征在于，步骤S3中计算用户标签关联知识数据的计算公式为U·A·TT≈Ut，通过梯度下降方法求解矩阵A；其中，Ut为样本用户标签标注矩阵，U为用户兴趣特征矩阵，T为标签兴趣特征矩阵，A为用户标签关联知识数据。5.根据权利要求4所述的一种用户可扩展的标签标注方法，其特征在于，所述步骤S4包括步骤：构建需要标注的用户的兴趣特征矩阵为U′,计算U′·A·TT，记结果为Ut′＝[u1,u2,u3…ui]T，其中行向量ui为第i个用户对应的标签标注权重；逐...

【专利技术属性】
技术研发人员：陆豪放，
申请(专利权)人：成都品果科技有限公司，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人