一种标签重构分类方法、装置、计算设备和存储介质制造方法及图纸

技术编号:37103138 阅读:25 留言:0更新日期:2023-04-01 05:02
本发明专利技术公开了一种标签重构分类方法、装置、计算设备和存储介质,该方法包括:提取样本外数据作为待分类数据,针对每一个待分类数据,依据待分类数据与训练数据在核空间中的近邻关系,提取得到待分类数据对应的近邻核内积矩阵;将待分类数据对应的近邻核内积矩阵通过投影分类器进行投影映射,得到近邻核内积矩阵内的每个近邻数据的软标签向量,依据多个近邻数据的软标签向量构建近邻软标签集;依据近邻软标签集对待分类数据进行软标签重构,得到待分类数据的归属类别标签。本发明专利技术通过在核空间对样本外数据进行软标签近邻重构,得到样本外数据的软标签确定其分类,解决了传统的诱导式方法对于线性不可分的数据不具有较好的分类能力和准度的问题。能力和准度的问题。能力和准度的问题。

【技术实现步骤摘要】
一种标签重构分类方法、装置、计算设备和存储介质


[0001]本专利技术涉及数据处理
,具体涉及一种标签重构分类方法、装置、计算设备和存储介质。

技术介绍

[0002]标签传播是基于标记和未标记数据之间的内在关系将标记数据的标记信息传播到未标记数据的过程,主要是在邻域保持和标签适应度上折衷流形平滑度。标签传播已经成功地应用于各种实际应用,例如,面部识别和图像分割。标签传播算法可归纳为两种类型:一种是直推式,只能对样本内的数据进行分类;另一种是诱导式,支持对样本外的扩展数据进行分类。
[0003]申请号为CN201711140253.9的专利文件公开了一种基于核正负标签传播的数据分类方法,该方法通过核函数将原始欧式空间的输入数据映射到更高维的核特征空间,并将负标签信息集成到传统的标签传播模型;该方法属于属于直推式方法,无法对样本外数据进行分类;另外,传统的诱导式分类方法主要针对数据线性可分的,对于线性不可分的数据不具有较好的分类能力和准度。

技术实现思路

[0004]鉴于上述问题,提出了本专利技术以便提供一种克服上述问本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种标签重构分类方法,其特征在于,包括:提取样本外数据作为待分类数据,针对每一个待分类数据,依据所述待分类数据与训练数据在核空间中的近邻关系,提取得到所述待分类数据对应的近邻核内积矩阵;将所述待分类数据对应的近邻核内积矩阵通过投影分类器进行投影映射,得到所述近邻核内积矩阵内的每个近邻数据的软标签向量,依据多个近邻数据的软标签向量构建近邻软标签集;依据所述近邻软标签集对所述待分类数据进行软标签重构,得到所述待分类数据的归属类别标签,依据所述归属类别标签确定所述待分类数据的类别。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据训练集中的训练数据进行训练测试,得到投影分类器;所述投影分类器用于构建数据的软标签。3.根据权利要求1所述的方法,其特征在于,在所述针对每一个待分类数据,依据所述待分类数据与训练数据在核空间中的近邻关系,提取得到所述待分类数据对应的近邻核内积矩阵之前,所述方法还包括:获取样本外数据集和训练集,对所述样本外数据集内的每一个样本外数据以及所述训练集内的每一个训练数据进行核空间映射,计算得到每一个样本外数据的核空间表现形式以及每一个训练数据的核空间表现形式;按照预设顺序对所有样本外数据的核空间表现形式以及所有训练数据的核空间表现形式进行排列,得到核空间表现形式集合。4.根据权利要求3所述的方法,其特征在于,所述针对每一个待分类数据,依据所述待分类数据与训练数据在核空间中的近邻关系,提取得到所述待分类数据对应的近邻核内积矩阵进一步包括:针对每一个待分类数据,从所述核空间表现形式集合中提取该待分类数据在核空间中的近邻数据;依据提取得到的近邻数据构建所述待分类数据对应的近邻核内积矩阵。5.根据权利要求1

4任一项所述的方法,其特征在于,所述依据所述近邻软标签集对所述待分类数据进行软标签重构,得到所述待分类数据的归属类别标签进一步包括:依据所述近邻软标签集确定所述待分类数据的软标签重构系数,计算得到所述待分类数据的软标签向量;在所述待分类数...

【专利技术属性】
技术研发人员:贾磊
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1