一种用户可扩展的标签标注方法及系统技术方案

技术编号:13999982 阅读:56 留言:0更新日期:2016-11-15 14:08
本发明专利技术公开一种用户可扩展的标签标注方法及系统,包括步骤步骤S1:对用户采样获取用户样本数据并标记用户的样本图片,生成样本用户标签标注矩阵;步骤S2:通过卷积神经网络对用户样本数据预处理,生成用户兴趣特征矩阵和标签兴趣特征矩阵;步骤S3:利用样本用户标签标注矩阵、用户兴趣特征矩阵和标签兴趣特征矩阵计算并生成用户标签关联知识数据;步骤S4:通过用户标签关联知识数据,计算生成用户新标签标注数据。本发明专利技术解决在对用户进行图像数据标签化处理过程中,如何合理地、低成本地完成对用户进行新的标签标注的问题,本发明专利技术有效地提升了在对用户进行新的标签化的过程中的计算效率和数据利用效率。

【技术实现步骤摘要】

本专利技术属于图像处理
,特别是涉及一种用户可扩展的标签标注方法及系统
技术介绍
目前大数据技术和商业智能技术正在飞速发展,互联网用户每天正在飞速地产生大量数据,这些数据中包含了结构化数据和非结构化数据,其中图片数据就是非结构化数据中占比极大的一块。基于用户的图像数据,挖掘用户的潜在兴趣点,在商业智能领域的需求已经非常巨大,伴随而生的深度学习、神经网络等技术也正日趋成熟商用。但这些技术的应用往往需要大量的GPU高昂硬件设备成本的付出,在对这些图片数据进一步进行处理的时候,会对同一张图片进行重复的GPU计算处理,消耗了大量不必要的计算资源,从而产生了极大的资源浪费。
技术实现思路
为了解决上述问题,本专利技术提出了一种用户可扩展的标签标注方法及系统,解决在对用户进行图像数据标签化处理过程中,如何合理地、低成本地完成对用户进行新的标签标注的问题,本专利技术有效地提升了在对用户进行新的标签化的过程中的计算效率和数据利用效率。为达到上述目的,本专利技术采用的技术方案是:一种用户可扩展的标签标注方法,步骤包括:步骤S1:对用户采样获取用户样本数据,并标记用户的样本图片,生成样本用户标签标注矩阵;步骤S2:通过卷积神经网络对用户样本数据预处理,生成用户兴趣特征矩阵和标签兴趣特征矩阵;步骤S3:利用样本用户标签标注矩阵、用户兴趣特征矩阵和标签兴趣特征矩阵计算并生成用户标签关联知识数据;步骤S4:通过用户标签关联知识数据,计算生成用户新标签标注数据。进一步的是,所述步骤S1包括步骤:对用户进行随机采样作为用户样本数据,标记用户收藏的图片作为样本图片;对样本图片进行标签标记,其中每张图片有多个标签标记或只有一个标签标记;利用用户样本数据和样本图片的标签标记生成样本用户的标签标注矩阵,其中第j个用户的标签特征向量由标记的图片标签归一化分布产生。进一步的是,所述步骤S2包括步骤:将每个用户样本数据作为卷积神经网络的输入数据,获取分类特征层的数值输出特征,每张图片输出一个固定维度的特征;将带有标签标注的样本图片依据用户进行归类,作为训练数据输入;综合归一化每个用户样本的特征维度,根据训练数据生成用户兴趣特征矩阵;将样本图片依据标签进行归类,作为训练数据输入;将生成的图片特征作为矩阵的横向量,构建图像特征矩阵;综合归一化每个标签样本的特征维度,生成标签兴趣特征矩阵。进一步的是,步骤S3中计算用户标签关联知识数据的计算公式为U·A·TT≈Ut,通过梯度下降方法求解矩阵A;其中,Ut为样本用户标签标注矩阵,U为用户兴趣特征矩阵,T为标签兴趣特征矩阵,A为用户标签关联知识数据。进一步的是,所述步骤S4包括步骤:构建需要标注的用户的兴趣特征矩阵为U′,计算U′·A·TT,记结果为Ut′=[u1,u2,u3…ui]T,其中行向量ui为第i个用户对应的标签标注权重;逐行抽取用户的新标签关联权重,并筛选适用于用户的新标签,输出用户的标签标注数据。进一步的是,对ui进行降序排序,通过设定阈值s对排序后的数据进行权重截断,获取新标签对用户i的权重标记,完成对用户的新标签标注。进一步的是,对权重向量进行降序排列,并截取其中前k位的标签,作为该用户的标注标签,输出用户的标签标注作为新标签。另一方面,本专利技术还提供了一种用于用户可扩展的标签标注方法的系统,包括数据获取模块:采样用户的样本用户数据并标记用户的样本图片,生成样本用户标签标注矩阵;预处理模块:连接数据获取模块,对用户样本图片数据预处理,生成用户兴趣特征矩阵和标签兴趣特征矩阵;计算模块:连接预处理模块,利用样本用户标签标注矩阵、用户兴趣特征矩阵和标签兴趣特征矩阵计算并生成用户标签关联知识数据;标签生成模块:连接计算模块,通过用户标签关联知识数据,计算生成用户新标签标注数据。进一步的是,向预处理模块输入对用户数据,并计算返回特征,合并为统一的向量数据,标准化用户的图片特征,该特征矩阵为用户的兴趣特征描述矩阵,包含全部样本用户数据;向图片预处理模块输入样本图片中各个标签的通用特征权重,该模块对特征数据其进行分维度取期望值;向预处理模块对需要进行新标签标注的用户进行样本图片的特征处理;将处理好的用户图片数据输入标签标注计算模块,进行矩阵运算,计算用户标签关联知识数据;逐行抽取用户的新标签关联权重,并对其进行降序排列,通过阈值来筛选适用于用户的新标签,输出用户的标签标注。进一步的是,向知识矩阵计算模块输入每个用户新标签的个数,该模块对用户的新标签权重进行标准化处理,生成样本用户标签数据;向知识矩阵计算模块输入预处理后的数据,对处理后的样本数据,该模块通过梯度下降方法对知识矩阵进行数值计算,并输出用户标签关联知识数据。采用本技术方案的有益效果:有效地提升了在对用户进行新的标签化的过程中的计算效率和数据利用效率;有效地利用了图片的卷积神经网络输出特征,减少了处理图片过程中卷积计算的频次,降低了在用户标签标记过程中的图像处理所需的硬件成本;易于扩展新的用户的标签数据,不需要多次对神经网络进行样本的模型训练。附图说明图1为本专利技术的一种用户可扩展的标签标注方法流程示意图;图2为本专利技术的实施例中步骤S1的流程示意图;图3为本专利技术的实施例中步骤S2中获取用户兴趣特征矩阵的流程示意图;图4为本专利技术的实施例中步骤S2中获取标签兴趣特征矩阵的流程示意图;图5为本专利技术的实施例中步骤S3的流程示意图;图6为本专利技术的实施例中步骤S4的流程示意图;图7为本专利技术实施例中一种用于用户可扩展的标签标注方法的系统的结构示意图。具体实施方式为了使本专利技术的目的、技术方案和优点更加清楚,下面结合附图对本专利技术作进一步阐述。在实施例中,参见图1所示,本专利技术提出了一种用户可扩展的标签标注方法,包括步骤步骤S1:对用户采样获取用户样本数据并标记用户的样本图片,生成样本用户标签标注矩阵,如图2所示;具体为:对用户进行随机采样作为用户样本数据,标记用户收藏的图片作为样本图片;对样本图片进行标签标记,其中每张图片有多个标签标记或只有一个标签标记;利用用户样本数据和样本图片的标签标记生成样本用户的标签标注矩 阵,其中第j个用户的标签特征向量由标记的图片标签归一化分布产生。优选实施例,如图2所示:步骤S1-1,采样用户,获取用户的图片数据。该步骤包含,通过随机采样的形式获取数据库中的用户数据,若用户的图片数量大于阈值,则采样该用户。步骤S1-2,将所有采样的用户标识ID生成列表文件;抽取用户的图片数据。步骤S1-3,抽取用户i的图片集合,对其进行新标签标注数据的统计,获取用户的标注特征μit,对其进行L2的标准化处理,得到Ut为样本用户标签标注矩阵。在该实施例中,读取采样用户标识列表文件,获取用户的图片数据,存放文件夹,并以用户的ID作为文件夹命名。步骤S2:通过卷积神经网络对用户样本数据预处理,生成用户兴趣特征矩阵和标签兴趣特征矩阵;提取图片特征数据,构建用户兴趣特征矩阵数据;通过对采样用户图片进行卷积神经网络分类特征的提取,该步骤中涉及到卷积神经网络的构建,不在该专利技术的涉及范围为现有技术。具体为,将每个用户的样本图片数据作为卷积神经网络的输入数据,获取分类特征层的数值输出特征,每张图片输出一个固定维度的特征;将带有标签标注的样本图片依据用户进行归类,作本文档来自技高网...

【技术保护点】
一种用户可扩展的标签标注方法,其特征在于,步骤包括;步骤S1:对用户采样获取用户样本数据,并标记用户的样本图片,生成样本用户标签标注矩阵;步骤S2:通过卷积神经网络对用户样本数据预处理,生成用户兴趣特征矩阵和标签兴趣特征矩阵;步骤S3:利用样本用户标签标注矩阵、用户兴趣特征矩阵和标签兴趣特征矩阵计算并生成用户标签关联知识数据;步骤S4:通过用户标签关联知识数据,计算生成用户新标签标注数据。

【技术特征摘要】
1.一种用户可扩展的标签标注方法,其特征在于,步骤包括;步骤S1:对用户采样获取用户样本数据,并标记用户的样本图片,生成样本用户标签标注矩阵;步骤S2:通过卷积神经网络对用户样本数据预处理,生成用户兴趣特征矩阵和标签兴趣特征矩阵;步骤S3:利用样本用户标签标注矩阵、用户兴趣特征矩阵和标签兴趣特征矩阵计算并生成用户标签关联知识数据;步骤S4:通过用户标签关联知识数据,计算生成用户新标签标注数据。2.根据权利要求1所述的一种用户可扩展的标签标注方法,其特征在于,所述步骤S1包括步骤:对用户进行随机采样作为用户样本数据,标记用户收藏的图片作为样本图片;对样本图片进行标签标记,其中每张图片有多个标签标记或只有一个标签标记;利用用户样本数据和样本图片的标签标记生成样本用户的标签标注矩阵,其中第j个用户的标签特征向量由标记的图片标签归一化分布产生。3.根据权利要求2所述的一种用户可扩展的标签标注方法,其特征在于,所述步骤S2包括步骤:将每个用户样本数据作为卷积神经网络的输入数据,获取分类特征层的数值输出特征,每张图片输出一个固定维度的特征;将带有标签标注的样本图片依据用户进行归类,作为训练数据输入;综合归一化每个用户样本的特征维度,根据训练数据生成用户兴趣特征矩阵;将样本图片依据标签进行归类,作为训练数据输入;将生成的图片特征作为矩阵的横向量,构建图像特征矩阵;综合归一化每个标签样本的特征维度,生成标签兴趣特征矩阵。4.根据权利要求3所述的一种用户可扩展的标签标注方法,其特征在于,步骤S3中计算用户标签关联知识数据的计算公式为U·A·TT≈Ut,通过梯度下降方法求解矩阵A;其中,Ut为样本用户标签标注矩阵,U为用户兴趣特征矩阵,T为标签兴趣特征矩阵,A为用户标签关联知识数据。5.根据权利要求4所述的一种用户可扩展的标签标注方法,其特征在于,所述步骤S4包括步骤:构建需要标注的用户的兴趣特征矩阵为U′,计算U′·A·TT,记结果为Ut′=[u1,u2,u3…ui]T,其中行向量ui为第i个用户对应的标签标注权重;逐...

【专利技术属性】
技术研发人员:陆豪放
申请(专利权)人:成都品果科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1