【技术实现步骤摘要】
融入成对约束先验信息的弱监督多视图学习方法
[0001]本专利技术属于模式识别
,具体涉及到一种融入成对约束先验信息的弱监督多视图学习方法。
技术介绍
[0002]传统监督分类方法均需要训练数据中有大量已标注的样本,然而,学习的一大难点就在于标签信息的获取。由于多标签样本的标注工作十分困难,在同等研究背景下,获取多标签样本的完整标签的代价更高、困难更大。在大数据时代,为一个样本数据提供一个完整的标签集需要耗费大量的人力物力,特别是对于具有极端标签数量的大规模数据则更为困难,因而多标签样本标注工作的高成本高代价的特性一直制约着多标签学习的发展。
[0003]相对于难以获取的精确标注信息而言,现实应用中往往潜在包含样本成对先验信息和多源特征结构信息等先验信息。多源特征随着数据采集技术提升,数据特征信息也不断累计;而成对先验约束信息包含必须链接和不链接约束,蕴含了一部分类别语义相关性结构信息。在实际应用中,数据往往含有除数据特征分布信息外,容易获得样本成对约束和多视角特征等弱监督先验信息。然而,传统聚类算法仅仅学习数 ...
【技术保护点】
【技术特征摘要】
1.一种融入成对约束先验信息的弱监督多视图学习方法,其特征是,所述方法包括:获取包括多个样本数据的视图数据集,并基于所述视图数据集获取相似矩阵图,所述视图数据集中包括必须链接的样本数据和必须不能链接的成对样本数据;根据必须不能链接的成对约束以及所述相似矩阵图对所述视图数据集进行聚类分析构建聚类联合学习模型;对所述聚类联合学习模型进行优化,获取求解的目标函数,所述目标函数包括分别表征成对约束先验信息及多源数据一致性信息的多个参数;循环迭代更新所述聚类联合学习模型的多个参数,直至所述目标函数收敛,并将所述目标函数收敛后得到的所述相似矩阵图作为所述视图数据集的数据聚类结果。2.如权利要求1所述的方法,其特征是,所述根据必须不能链接的成对约束以及所述相似矩阵图对所述视图数据集进行聚类分析构建聚类联合学习模型,包括:根据所述相似矩阵图确定拉普拉斯矩阵;根据所述视图数据集中的必须不能链接的成对样本数据以及所述拉普拉斯矩阵将不能链接的成对约束与所述相似矩阵图关联,获取表征成对约束先验信息的第一图正则项;基于所述视图数据集将多源数据矩阵与所述相似矩阵图耦合,获取表征多源数据一致性信息的一致性信息模型;将所述第一图正则项与所述一致性信息模型融合处理,得到聚类联合学习模型。3.如权利要求2所述的方法,其特征是,所述根据所述视图数据集中的必须不能链接的成对样本数据以及所述拉普拉斯矩阵将不能链接的成对约束与所述相似矩阵图关联,获取表征成对约束先验信息的第一图正则项,包括:定义y∈R
n
是不能链接样本的指示向量,对于任一对必须不能链接的成对样本数据(
i
,
j
),y
i
=1,y
j
=
‑
1,R
n
表示n个样本数据的关系集合;根据不能链接样本的指示向量以及所述拉普拉斯矩阵L
s
将不能链接的成对约束与所述相似矩阵图关联,获取表征成对约束先验信息的第一图正则项y
T
L
S
y。4.如权利要求2所述的方法,其特征是,所述基于所述视图数据集将多源数据矩阵与所述相似矩阵图耦合,获取表征多源数据一致性信息的一致性信息模型,包括:基于自表达学习理论可以获取样本相似性信息;根据所述样本相似性信息结合多源数据的低秩约束构建一致性信息模型的损失函数;对所述损失函数进行合理简化,并引入一个保持数据全局几何结构信息的第二图正则项,得到表征多源数据一致性信息的一致性信息模型。5.如权利要求2所述的方法,其特征是,所述将所述第一图正则项与所述一致性信息模型融合处理,得到聚类联合学习模型,包括:将所述第一图正则项与所述一致性信息模型融合,得到初始学习模型;在所述初始学习模型基础上增加所述拉普拉斯矩阵的秩约束,得到聚类联合学习模型。6.如权利要求2所述的方法,其特征是,所述在所述初始学习模型基础上增加所述拉普拉斯矩阵的秩约束,得到聚类联合学习模型,包括:根据所述拉普拉斯矩阵L
s
中特征值为零的个数与所述相似矩阵图S中连通分量...
【专利技术属性】
技术研发人员:罗廷金,李泉江,刘玥瑛,侯臣平,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。