一种多标签分类方法及其装置制造方法及图纸

技术编号：12029317 阅读：322 留言：0更新日期：2015-09-10 15:11

本发明专利技术公开了一种多标签分类方法及相应装置，该方法利用问题转换算法将多标签分类问题转换成多个单标签分类问题；对于每个待预测的未标签实例X*，计算第j个预测实数值j＝1，…，q，q为标签向量的维数；判断每个待预测标签实例X*的第j个预测实数值所属类别；综合所有单标签完成多标签分类。本发明专利技术提出的多标签分类方法通过特定的技术手段，将待预测样本标签进行标记，结果为与已知训练样本的距离最接近的标签，而无需计算每个样本之间的距离，运算效率高于ML-KNN，可以应用于大数据处理，可应用于生物信息、文本分类和音乐分类等多标签分类中。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及机器学习、模式识别和数据挖掘，特别涉及一种多标签分类方法及其相应装置。
技术介绍
多标签最先应用在自动文档分类。随着最近一些年海量数字信息的出现，人们迫切需要开发出自动方法来对这些内容进行自动注释。比如，Irieetal.提出了用于电影情感场景（movieaffectivescene)多标签分类方法，Suetal.给出一种方法叫图像-概念分布模型注释方法（annotationbyImage-to-ConceptDistributionModel，AICDM)用于图像注释，而Loetal.记录标签次数作为代价，将声音标记问题转变成代价敏感分类问题（cost-sensitiveclassificationproblem)。如今，除了自动内容注释，多标签学习应用到许多其他领域，包括生物信息，网络挖掘，图像等。解剖治疗化学（AnatomicalTherapeuticChemical，ATC)分类系统是著名的，被世界健康组织（theWorldHealth0rganization，WH0)推荐的药物分类系统。识别药物的 ATC分类是一个重要的课题，它有助于对药物的开发和利用。现有的药物ATC分类系统仅仅是用于药物的单标签（single-label，单标记）分类。单标签分类学习是从一个只属于一个标签I的样本集合中学习，其中每一个标签属于一个互斥的标签集合L(|L| >1)。在多标签（多标记，multi-label)分类中，每个样本属于一个L样本集合的一个子集。多标签（multi-label)分类器给一个新的实例...

【技术保护点】
一种多标签分类方法，其特征在于，所述方法包括：步骤1，利用问题转换算法将多标签分类问题转换成多个单标签分类问题；步骤2，对于每个待预测的未标签实例X*，计算第j个预测实数值j＝1，…，q，q为标签向量的维数；步骤3，判断每个待预测标签实例X*的第j个预测实数值所属类别；步骤4，综合所有单标签完成多标签分类。

【技术特征摘要】

【专利技术属性】
技术研发人员：程翔，肖绚，
申请(专利权)人：景德镇陶瓷学院，
类型：发明
国别省市：江西;36

全部详细技术资料下载我是这个专利的主人