一种面向多视角多标签数据的隐语义学习方法技术

技术编号：22166896 阅读：23 留言：0更新日期：2019-09-21 10:34

本发明专利技术提供了一种面向多视角多标签数据的隐语义学习方法，包括：读取多视角多标签数据作为预处理器的输入，然后进行数据预处理，并将预处理结果输入到训练器中，学习得到隐语义子空间和训练后的模型。预测未标注多视角数据的标签时，将未标注的多视角数据进行预处理，然后输入到训练好的模型中预测得到多标签类别。本发明专利技术中提出了一种融合多个视角信息的学习和多标签分类方法，将输入特征和输出多标签映射到共同的潜在语义子空间中。该方法能够处理高维稀疏数据所带来的维数灾难问题，同时融合多视角信息对多标签数据进行分类。

A Hidden Semantic Learning Method for Multi-view and Multi-label Data

全部详细技术资料下载

【技术实现步骤摘要】
一种面向多视角多标签数据的隐语义学习方法
本专利技术一般涉及网络中的矩阵分析、正交约束方法及最优化方法，更具体地,涉及一种面向多视角多标签数据的隐语义学习方法。
技术介绍
近年来，以大数据、物联网、人工智能、5G为核心特征的数字化浪潮正席卷全球，由此带来了各个领域的海量数据。因此针对图像领域的分类问题、视频概念的自动标注一直受到学术界和工业界热切关注。而随着音乐数据库的规模和数量的增长，情感检索音乐已成为移动设备的歌曲选择、音乐推荐系统、电视广播节目和音乐治疗等各种应用的重要任务。多视角多标签学习在这些场景都是需要的，因为现实中很多数据并不是来自单一信息源，也不仅仅只有单一的标签，多视角多标签学习有很多实际应用需求例如：对文章的主题分类可以用于个性化推荐，对视频进行标注以及用于音乐个性化推荐系统，融合多视角和多标签数据有利于提高分类任务的准确性。对于多视角多标签数据的融合，主要存在以下几个难点：1.数据高维稀疏。任务中的数据往往分布在一个高维稀疏空间中，不太方便处理，维度太高导致采用的分类模型的复杂度也相应增高，最终导致分类模型容易过拟合。2.多视角数据的融合。普遍认为不同视角之间信息是互补的，通过融合不同视角的数据可以提升学习效果，现有的方法效果并不是很理想，如何有效地融合多视角信息成为了急需解决的问题。3.隐语义空间的学习。隐语义空间学习的主要问题，就是如何将特征从高维空间压缩到低维空间，需要保留什么样的信息，设定什么样的准则。多视角多标签学习的基本目标就是解决上述信息处理存在的困难。然而，现有的方法中，还没有一个有效的方法能够高效地解决以上的问题。目...

【技术保护点】
1.一种面向多视角多标签数据的隐语义空间学习方法，其特征在于，包括以下步骤：S1.读取多视角多标签数据进行预处理，预处理部分去除文本数据的停用词并通过关键词权重计算算法将数据向量化，将预处理得到的特征向量化结果作为方法的输入；S2.构建面向多视角多标签数据的隐语义学习模型；S3.进行模型训练：通过交替方向乘子法和bregman迭代将带约束的隐语义空间学习问题转换成无约束的多组变量交替求解的子问题，并且通过奇异值分解更新隐语义空间，得到模型迭代后的矩阵；S4.将模型迭代得到的矩阵用于对新输入的多视角多标签数据的预测。

【技术特征摘要】
1.一种面向多视角多标签数据的隐语义空间学习方法，其特征在于，包括以下步骤：S1.读取多视角多标签数据进行预处理，预处理部分去除文本数据的停用词并通过关键词权重计算算法将数据向量化，将预处理得到的特征向量化结果作为方法的输入；S2.构建面向多视角多标签数据的隐语义学习模型；S3.进行模型训练：通过交替方向乘子法和bregman迭代将带约束的隐语义空间学习问题转换成无约束的多组变量交替求解的子问题，并且通过奇异值分解更新隐语义空间，得到模型迭代后的矩阵；S4.将模型迭代得到的矩阵用于对新输入的多视角多标签数据的预测。2.根据权利要求1所述的面向多视角多标签数据的隐语义空间学习方法，其特征在于，所述的S2包括以下步骤：基于将数据映射到低维空间最小化重构误差的原理，构建融合不同视角和特点的分类器，同时结合多标签的相关性，构建面向多视角多标签数据的隐语义学习模型。3.根据权利要求2所述的面向多视角多标签数据的隐语义空间学习方法，其特征在于，所述的隐语义学习模型如下：其中，定义Γ为视角个数，γ＝1,...,Γ是相应的视角，X＝[X1,...,XΓ]是输入不同视角的特征矩阵，αγ是不同视角对应的权重系数，V为隐语义空间，I为单位矩阵，同时令W＝[W1,...,WΓ]为各个视角对应的权重矩阵，Y为输入特征矩阵对应的多标签矩阵，当标签为正时Y的元素值取值为1，标签为负时Y的元素值取值为-1；A＝[A1,...,AΓ]表示为每个视角到隐...

【专利技术属性】
技术研发人员：温雯，韦滨，蔡瑞初，郝志峰，陈炳丰，
申请(专利权)人：广东工业大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人