一种类别分析方法及系统技术方案

技术编号:20045837 阅读:48 留言:0更新日期:2019-01-09 04:27
本发明专利技术公开了一种类别分析方法,包括:提供一测试集,所述测试集包括多张真实类别为第一类别的测试图片;使用一多分类模型对所述多张测试图片进行识别,获取每一张测试图片被识别的多个预测类别,以及每个预测类别对应的置信度;设置一置信度阈值,统计每一张测试图片中置信度大于所述置信度阈值的预测类别,获取所有置信度大于所述置信度阈值的预测类别对应的图片数量;设置一相关数量阈值,将所述步骤S3中所有图片数量大于所述相关数量阈值的预测类别,标记为所述第一类别的相关类别,能够准确分析出哪些类别之间存在相关性或者干扰性,更好的有利于数据进一步的分析。

【技术实现步骤摘要】
一种类别分析方法及系统
本专利技术属于无线
,特别涉及一种类别分析方法及系统。
技术介绍
随着计算机科学与技术的发展,机器学习算法越来越广泛地应用于数据的分类中。在输出数据的分类结果时,我们可以输出总的数据分类准确率和单个类别的准确率。根据输出的分类结果,有时会遇到在总的准确率很高的情况下,单个类别的准确率可能会很低。比如,根据卷积神经网络做菜品识别时,总的输出准确率很高,但是其中会有一些单个的菜品准确率很低。因此,如何通过正确的分析方法,分析各类别之间的关系,对我们改进算法,或者进一步清理数据会有准确的指导意义。
技术实现思路
鉴于此,本专利技术的目的在于提供一种类别分析方法及系统,能够准确分析出哪些类别之间存在相关性或者干扰性,更好的有利于数据进一步的分析。根据上述专利技术目的,本专利技术提供一种类别分析方法,所述方法包括:S1、提供一测试集,所述测试集包括多张真实类别为第一类别的测试图片;S2、使用一多分类模型对所述多张测试图片进行识别,获取每一张测试图片被识别的多个预测类别,以及每个预测类别对应的置信度;S3、设置一置信度阈值,统计每一张测试图片中置信度大于所述置信度阈值的预测类别,获取所有置信度大于所述置信度阈值的预测类别对应的图片数量;S4、设置一相关数量阈值,将所述步骤S3中所有图片数量大于所述相关数量阈值的预测类别,标记为所述第一类别的相关类别。优选地,于所述步骤S1包括:根据神经网络算法对训练集的图片进行训练,构建一多分类模型。优选地,所述步骤S4还包括:获取所述相关类别对应的测试图片数量;根据每一张测试图片识别为所述相关类别所对应的置信度,以及所述图片数量,得到所述相关类别的平均相关置信度。优选地,所述方法还包括:设置所述第一类别对应的真实置信度;统计每一张测试图片中置信度大于所述真实置信度的预测类别,获取所有置信度大于所述真实置信度的预测类别对应的图片数量;设置一干扰数量阈值,将所述所有置信度大于所述真实置信度的预测类别对应的图片数量大于所述干扰数量阈值的预测类别,标记为所述第一类别的干扰类别。优选地,所述方法还包括:获取所述干扰类别对应的图片数量;根据每一张测试图片识别为所述干扰类别所对应的置信度,以及所述图片数量,得到所述干扰类别的平均干扰置信度。根据上述专利技术目的,本专利技术提供一种类别分析系统,所述系统包括:测试集模块,用于提供一测试集,所述测试集包括多张真实类别为第一类别的测试图片;识别模块,用于使用一多分类模型对所述多张测试图片进行识别,获取每一张测试图片被识别的多个预测类别,以及每个预测类别对应的置信度;统计模块,用于设置一置信度阈值,统计每一张测试图片中置信度大于所述置信度阈值的预测类别,获取所有置信度大于所述置信度阈值的预测类别对应的图片数量;相关模块,用于设置一相关数量阈值,将所述统计模块中所有图片数量大于所述相关数量阈值的预测类别,标记为所述第一类别的相关类别。优选地,所述系统还包括一构建模块,用于根据神经网络算法对训练集的图片进行训练,构建一多分类模型。优选地,所述系统还包括平均相关置信度模块,用于获取所述相关类别对应的测试图片数量,并根据每一张测试图片识别为所述相关类别所对应的置信度,以及所述图片数量,得到所述相关类别的平均相关置信度。优选地,所述系统还包括:设置模块,用于设置所述第一类别对应的真实置信度;记录模块,用于统计每一张测试图片中置信度大于所述真实置信度的预测类别,获取所有置信度大于所述真实置信度的预测类别对应的图片数量;干扰模块,用于设置一干扰数量阈值,将所述所有置信度大于所述真实置信度的预测类别对应的图片数量大于所述干扰数量阈值的预测类别,标记为所述第一类别的干扰类别。优选地,所述系统还包括平均干扰置信度模块,用于获取所述干扰类别对应的图片数量,并根据每一张测试图片识别为所述干扰类别所对应的置信度,以及所述图片数量,得到所述干扰类别的平均干扰置信度。与现有技术相比,本专利技术提供的类别分析方法及系统,具有以下有益效果:本专利技术能够很好地分析出各个类别之间的关系,哪些类别之间是相关类别,哪些类别之间是干扰类别,对改进算法、后续的数据分析以及数据清洗等都具有指导意义;根据神经网络只训练一个多分类模型,与训练多个二分类模型相比,训练时间上比较短,多个二分类模型需要不停加载释放模型或者一次性加载多个模型,要么会需要花费大量额外的时间,要么需要使用非常大的显存;对测试集的图片进行测试,原来每张图片需要输入多个二分类模型测试,现在只要通过一个多分类模型测试,测试时间花费根据二分类模型数量成倍减少;综合考虑多个分类的情况提取的特征,能够更准确区分各个分类之间的差异,与多个二分类模型相比,有一个统一的标准,准确性高。附图说明下面将以明确易懂的方式,结合附图说明优选实施方式,对一种类别分析方法及系统的上述特性、技术特征、优点及其实现方式予以进一步说明。图1是本专利技术一种类别分析方法的流程图;图2是本专利技术一种类别分析系统的组成结构图。具体实施方式为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对照附图说明本专利技术的具体实施方式。显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。为使图面简洁,各图中只示意性地表示出了与本专利技术相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。如图1所示,本专利技术的一个实施例,一种类别分析方法,所述方法包括:S1、提供一测试集,所述测试集包括多张真实类别为第一类别的测试图片;S2、使用一多分类模型对所述多张测试图片进行识别,获取每一张测试图片被识别的多个预测类别,以及每个预测类别对应的置信度;S3、设置一置信度阈值,统计每一张测试图片中置信度大于所述置信度阈值的预测类别,获取所有置信度大于所述置信度阈值的预测类别对应的图片数量;S4、设置一相关数量阈值,将所述步骤S3中所有图片数量大于所述相关数量阈值的预测类别,标记为所述第一类别的相关类别。本专利技术的一具体实施例,于所述步骤S1包括:根据神经网络算法对训练集的图片进行训练,构建一多分类模型。根据神经网络算法,对多个训练样本图片进行训练,构建一个多分类模型。该多分类模型只需要加载一次模型,综合考虑多个分类的情况提前的特征,能够更准确区分各个分类之间的差异,相比较使用多个二分类模型进行图像识别,测试时间耗费较短。提供一测试集,所述测试集包括多张真实类别为第一类别的测试图片。所述测试集包括多张测试图片。设置所述多张测试图片的真实类别,并标记所述真实类别为第一类别。使用所述多分类模型对所述多张测试图片进行识别,获取每一张测试图片被识别的多个预测类别,以及每个预测类别对应的置信度。通过所述多分类模型每一张测试图片进行图像识别,每一张测试图片可以被识别为多个预测类别,并设置每一个预测类别的置信度。即每一张测试图片对应多个预测类别,每一个预测类别对应一个置信度。设置一置信度阈值,统计每一张测试图片中置信度大于所述置本文档来自技高网...

【技术保护点】
1.一种类别分析方法,其特征在于,所述方法包括:S1、提供一测试集,所述测试集包括多张真实类别为第一类别的测试图片;S2、使用一多分类模型对所述多张测试图片进行识别,获取每一张测试图片被识别的多个预测类别,以及每个预测类别对应的置信度;S3、设置一置信度阈值,统计每一张测试图片中置信度大于所述置信度阈值的预测类别,获取所有置信度大于所述置信度阈值的预测类别对应的图片数量;S4、设置一相关数量阈值,将所述步骤S3中所有图片数量大于所述相关数量阈值的预测类别,标记为所述第一类别的相关类别。

【技术特征摘要】
1.一种类别分析方法,其特征在于,所述方法包括:S1、提供一测试集,所述测试集包括多张真实类别为第一类别的测试图片;S2、使用一多分类模型对所述多张测试图片进行识别,获取每一张测试图片被识别的多个预测类别,以及每个预测类别对应的置信度;S3、设置一置信度阈值,统计每一张测试图片中置信度大于所述置信度阈值的预测类别,获取所有置信度大于所述置信度阈值的预测类别对应的图片数量;S4、设置一相关数量阈值,将所述步骤S3中所有图片数量大于所述相关数量阈值的预测类别,标记为所述第一类别的相关类别。2.如权利要求1所述的类别分析方法,其特征在于,于所述步骤S1包括:根据神经网络算法对训练集的图片进行训练,构建一多分类模型。3.如权利要求1所述的类别分析方法,其特征在于,所述步骤S4还包括:获取所述相关类别对应的测试图片数量;根据每一张测试图片识别为所述相关类别所对应的置信度,以及所述图片数量,得到所述相关类别的平均相关置信度。4.如权利要求1所述的类别分析方法,其特征在于,所述方法还包括:设置所述第一类别对应的真实置信度;统计每一张测试图片中置信度大于所述真实置信度的预测类别,获取所有置信度大于所述真实置信度的预测类别对应的图片数量;设置一干扰数量阈值,将所述所有置信度大于所述真实置信度的预测类别对应的图片数量大于所述干扰数量阈值的预测类别,标记为所述第一类别的干扰类别。5.如权利要求4所述的类别分析方法,其特征在于,所述方法还包括:获取所述干扰类别对应的图片数量;根据每一张测试图片识别为所述干扰类别所对应的置信度,以及所述图片数量,得到所述干扰类别的平均干扰置信度。6.一种类别分析系统,其特征在于,所述系统包括:测试集模块,用于提...

【专利技术属性】
技术研发人员:徐兴
申请(专利权)人:上海康斐信息技术有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1