【技术实现步骤摘要】
一种标签分布预测方法及装置
本专利技术涉及数据处理
,特别涉及一种标签分布预测方法及装置。
技术介绍
在图像识别、视频解析等领域,针对所输入的一个实例,所需要的输出结果是整个标签集的分布向量,分布向量中的每一个元素为标签集中相对应标签描述该实例的程度。比如,在根据一个学生的照片预测该学生的年龄时,如果预估这个学生的年龄为18至22岁,则相当于估计这个学生的年龄属于年龄标签集[18,19,20,21,22]中每个元素的可能性,如果18岁的可能性为10%,19岁的可能性为20%,20岁的可能性为40%,21岁的可能性为20%,22岁的可能性为10%,则所需要的输出结果为年龄标签集[18,19,20,21,22]的分布向量为[0.1,0.2,0.4,0.2,0.1]。目前,一般通过标签分布学习算法(LabelDistributionLearning,LDL)对实例进行标签分布预测,以确定实例针对整个标签集的分布向量。由于标签分布学习算法中的标签是由专家人为给出或通过机器学习获得,这使得标签的划分边界存在模糊性,即不同标签之间是相互关联的,而目前利用标签分布学习算法 ...
【技术保护点】
1.一种标签分布预测方法,其特征在于,包括:S1:获取训练集合,并初始化潜在因子矩阵,其中,所述训练集合包括有至少一个样本的特征信息和实际标签分布信息,所述潜在因子矩阵用于从特征信息到标签分布的转换;S2:根据所述训练集合和所述潜在因子矩阵构建基础目标函数,其中,所述基础目标函数用于衡量实际标签分布与预测标签分布之间的差距;S3:根据所述潜在因子矩阵构建距离映射函数,其中,所述距离映射函数用于描述标签相关性;S4:根据所述基础目标函数和所述距离映射函数构建目标函数;S5:针对所述目标函数对所述潜在因子矩阵求一阶偏导,获得一阶偏导向量;S6:将初始化后的所述潜在因子矩阵确定为 ...
【技术特征摘要】
1.一种标签分布预测方法,其特征在于,包括:S1:获取训练集合,并初始化潜在因子矩阵,其中,所述训练集合包括有至少一个样本的特征信息和实际标签分布信息,所述潜在因子矩阵用于从特征信息到标签分布的转换;S2:根据所述训练集合和所述潜在因子矩阵构建基础目标函数,其中,所述基础目标函数用于衡量实际标签分布与预测标签分布之间的差距;S3:根据所述潜在因子矩阵构建距离映射函数,其中,所述距离映射函数用于描述标签相关性;S4:根据所述基础目标函数和所述距离映射函数构建目标函数;S5:针对所述目标函数对所述潜在因子矩阵求一阶偏导,获得一阶偏导向量;S6:将初始化后的所述潜在因子矩阵确定为第一因子矩阵;S7:将所述第一因子矩阵代入所述一阶偏导向量,获得一阶梯度矩阵;S8:判断所述一阶梯度矩阵的F范数是否小于预先设定的临界阈值,如果是,执行S10,否则执行S9;S9:对所述潜在因子矩阵进行一次迭代优化,将迭代优化后的所述潜在因子矩阵确定为所述第一因子矩阵,并执行S7;S10:根据所述第一因子矩阵,获得待预测实例的标签分布向量。2.根据权利要求1所述的方法,其特征在于,所述距离映射函数包括:g(θi,θj)=sgn(triangle(θi,θj))·dis(θi,θj),其中,其中,所述sgn(triangle(θi,θj))表征所述潜在因子矩阵中因子向量θi与因子向量θj之间的相关性;所述θik表征所述潜在因子矩阵中第i个因子向量中的第k个元素;所述θjk表征所述潜在因子矩阵中第j个因子向量中的第k个元素;所述m表征所述训练集合中每个样本的特征的个数。3.根据权利要求2所述的方法,其特征在于,所述基础目标函数包括:其中,所述T0(θ)表征所述基础目标函数;所述所述θjr表征所述潜在因子矩阵中第j个因子向量中的第r个元素,所述xir表征所述训练集合中第i个样本的第r个特征对应的数值;所述dij表征所述训练集合所包括的所述实际标签分布信息中第j个标签描述第i个样本的程度;所述n表征所述训练集合中样本的总个数;所述c表征所述训练集合中标签的总个数。4.根据权利要求3所述的方法,其特征在于,所述S4包括:根据所述潜在因子矩阵确定正则项;根据所述基础目标函数、所述距离映射函数和所述正则项,构建如下目标函数;其中,所述T(θ)表征所述目标函数;所述θij表征所述潜在因子矩阵中第i个因子向量中的第j个元素;所述λ1和所述λ2为预设的系数;所述表征所述正则项。5.根据权利要求1所述的方法,其特征在于,所述S9包括:S91:将当前的所述第一因子矩阵代入如下第一公式,计算搜索方向参数;所述第一公式包括:其中,所述θ(l)表征当前的所述第一因子矩阵,所述l为非负整数,l+1表征已对所述潜在因子矩阵进行的迭代优化的次数;所述d(l)表征所述搜索方向参数;所述表征当前的所述一阶梯度矩阵;所述H(θ(l))表征基于当前的所述第一因子矩阵的海森矩阵;S92:将当前的所述第一因子矩阵和所述搜索方向参数代入如下第二公式,计算第二因子矩阵;所述第二公式包括:θ(l+1)=θ(l)+d(l)其中,所述θ(l+1)表征所述第二因子矩阵,默认搜索步长为1;S93:将所述第二因子矩阵作为新的所述第一因子矩阵,并执行S7。6.根据权利要求1至5中任一所述的方法,其特征在于,在所述S10之前,进一步包括:获取测试集合,其中,所述测试集合包括有至少一个样本的特征信息和实际标签分布信息;根据所述测试集合对应的样本特征矩阵和所述第一因子矩阵,获得对应于所述...
【专利技术属性】
技术研发人员:张恒汝,黄雨婷,徐媛媛,闵帆,
申请(专利权)人:西南石油大学,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。