【技术实现步骤摘要】
一种多标签分类模型训练方法
[0001]本专利技术涉及深度学习模型
,特别是涉及一种多标签分类模型训练方法。
技术介绍
[0002]深度学习模型发展进程中,传统数据挖掘单标签分类技术也称为多类分类技术,它由已知的有限标签集L将实例x与单个标签1关联在一起。单标签数据集D为{(x1,l1),
…
,(x
n
,l
n
)};多标签分类S是L的一个真子集,即S中的元素为{(x1,S1),
…
,(x
n
,S
n
)}。多标签分类技术受到越来越多的关注,并且众多领域得到应用,比如在文本分类、基因组合等领域的应用。
[0003]多标签分类比较常见的技术方案是把多标签分类问题转化为单标签分类问题,或把多标签问题转化为多个单标签分类问题。这种技术方案可以使用单标签分类器进行单标签分类,然后这些分类器将转换为多标签表示,而实现这种技术方案的方法有:朴素贝叶斯法、支持向量机和K
‑
最邻近算法。
[0004]纵观这些技术方案,多标签分类问题转化为单标签分类问题的本质还是应用单标签分类技术,而在转化过程中,由于对现有算法的修改、叠加、嵌套调用使整个训练模型复杂度增加了数倍,效率也降低了数倍;如果标签集L规模庞大,转化技术基本没有实际使用意义。这种实际情况给这些应用领域的人们应用标签分类技术造成很大的应用困扰。
[0005]由此可以看出,现有多标签分类模型训练方法以单标签分类模型训练方法转化的方 ...
【技术保护点】
【技术特征摘要】
1.一种多标签分类模型训练方法,其特征在于,包括步骤:S1)输入训练集X={(x1,l1),(x2,l2),
…
,(x
n
,l
n
)},输入单二进制分类器序列C={c1,c2,
…
,c
n
},输入顺序集K={k1,k2,
…
,k
n
},所述顺序集K={k1,k2,
…
,k
n
}是单二进制分类器序列C的排列顺序,其中,c
k
是单二进制分类器序列C的第k个元素,x1,x2,
…
,x
n
∈S,S是实例集,其中,l1,l2,
…
,l
n
∈L,L是标签集,|L|是标签集L的长度;S2)按照单二进制分类器序列C的排列顺序,用c
k
去预测样本集X的第i个元素x
i
是否包含标签集L的第j个标签l
j
,有:S3)记P
k
(x
i
)是c
k
用样本x
i
逐个预测了标签集L的所有元素c
k
(x
i
,l1),c
k
(x
i
,l2),
…
,c
k
(x
i
,i
|L|
)的并集,即:P
k
(x
i
)={c
k
(x
i
,l1)∪c
k
(x
i
,l2)∪
…
∪c
k
(x
i
,l
|L|
)};S4)记F
y
是P
y
(x1),P
y
(x2),
…
,P
y
(x
n
)的集合,即:F
y
={P
y
(x1),P
y
(x...
【专利技术属性】
技术研发人员:邓彪,
申请(专利权)人:中科凡语武汉科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。