一种结合支持向量机和投影矩阵的多标签分类方法技术

技术编号：22102360 阅读：30 留言：0更新日期：2019-09-14 03:29

本发明专利技术公开了一种结合支持向量机和投影矩阵的多标签分类方法，包括下述步骤：S1，参数设置；首先设置最大训练步长T和样本的批量大小；设置超参数：如权衡参数β，正则化参数γ和比较阈值τ；本发明专利技术基于一致KL散度目标模型将多标签分类问题分为两部分，既能通过构造一组新的SVM模型直观地确定样本和标签的关系，又能充分利用标签之间的信息，通过构建一个新的投影矩阵来确定标签与标签之间的内在关系，从而提高分类的效果；在建立一致目标模型的同时可以分别对两部分损失进行优化，从而降低了复杂度。

A Multi-label Classification Method Combining Support Vector Machine and Projection Matrix

全部详细技术资料下载

【技术实现步骤摘要】
一种结合支持向量机和投影矩阵的多标签分类方法
本专利技术涉及多标签分类
，具体涉及一种结合支持向量机和投影矩阵的多标签分类方法。
技术介绍
随着大数据时代的发展，数据爆炸性地进行增长，如何快速、准确地处理数据得到越来越多人的关注。现有的多标签分类方法计算效率低，不适合用于大数据和高维特征数据，或者准确性不高，限制了多标签分类在实际生活中的应用；而且，现有的多标签分类方法不能很好的利用标签之间的相关性或者确定标签关系的形式过于复杂，导致了分类的性能较差或者算法的复杂度急剧上升。在多标签分类中，每个样本不再对应唯一的标签，其目的在于为未见的样本赋予合适的标签集。多标签分类不同于多类分类，多类分类是指给定样本中分配一个标签。但在实际生活中，多标签分类比单标签分类更为实用。例如，一张图片，画面内容可能包含多种元素，如沙发、餐桌、椅子等。对图片进行类别划分就属于多标签分类问题。在现有的对多标签分类的研究中，最常见的多标签分类方法有两类：(I)算法适应方法(Algorithmadaptationmethods)，算法适应方法就是将原来的单标签分类算法进行扩展以能够直接处理多标签分类问题，C2AE，ML-DT和RankSVM都是算法适应方法；(II)问题转换方法(Problemtransformationmethods)，问题转换方法是将多标签分类问题转换成一个或多个单标签分类问题，最常见的问题转换方法就是二元关联(Binaryrelevance，BR)方法，标签幂集(Labelpower-set，LP)方法和标签排序(Labelranking)方法。多标签数据具...

【技术保护点】
1.一种结合支持向量机和投影矩阵的多标签分类方法，其特征在于，包括下述步骤：S1，参数设置；首先设置最大训练步长T和样本的批量大小；设置超参数：如权衡参数β，正则化参数γ和比较阈值τ；S2，特征映射；利用映射

【技术特征摘要】
1.一种结合支持向量机和投影矩阵的多标签分类方法，其特征在于，包括下述步骤：S1，参数设置；首先设置最大训练步长T和样本的批量大小；设置超参数：如权衡参数β，正则化参数γ和比较阈值τ；S2，特征映射；利用映射即可得到样本xi对应的特征描述zi；S3，确定样本与子标签的关系；将样本xi映射后所得到的特征描述zi作为多元SVMs的输入；定义第l个SVM分类器对第l个标签的预测如下：其中，W中的每一列对于每一个标签都是一个one-against-all的二元分类器，即利用每一个SVM分类器将一个样本标注一个标签而忽略其他标签，这样就把一个多标签分类问题转化为多个二分类问题，从而得到一组子标签来确定样本与标签之间关系；多元SVMs根据向量来生成每个标签的分类得分，接着利用sigmoid函数对多元SVMs生成的分类得分进行标准化，将这些分类得分映射到0至1的范围内，生成这些分类得分的概率描述，即子标签的条件概率S4，确定子标签与标签的关系；利用投影矩阵对每个标签之间的关系进行建模；投影矩阵中的所有变量用Θ来表示，在投影矩阵中，当且仅当第l个标签与样本xi有关联时，标签yl取值为1，否则取值为0；在给定概率描述对于任意第i个样本的标签的预测定义如下：而对于第l个标签的最终预测，预测的结果是通过阈值比较得出的：其中τ是设置的比较阈值，1为指示函数；S5，计算损失函数；为了更好的确定子标签与标签之间的关系，从而提高多标签分类问题的分类效果，通过利用KL散度来最小化标签与子标签同时观测的概率与模型的观测概率的偏差；而对于KL散度的最小化会导致两部分的损失：(1)计算确定样本与标签的关系时构建多元SVMs所造成...

【专利技术属性】
技术研发人员：刘芷菁，刘波，林露樾，肖燕珊，
申请(专利权)人：广东工业大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人