基于级联均值向量综合评分的图片多级分类方法及系统技术方案

技术编号:30375615 阅读:19 留言:0更新日期:2021-10-16 18:04
本发明专利技术涉及图像分类领域,提供一种基于级联均值向量综合评分的图片多级分类方法及系统,包括:通过样本图片集合构建样本图片特征向量集合,样本图片特征向量集合包括多个特征类别;计算样本图片特征向量集合中各特征类别的均值向量,获得均值向量集合;提取待分类图片的待分类图片特征向量;迭代计算待分类图片特征向量与均值向量集合中各特征类别的均值向量之间的欧式距离,获得欧式距离集合;通过欧式距离集合计算获得待分类图片的分类结果。本发明专利技术能提高多级分类准确度,有效解决包括未考虑类间亲疏性所造成的分类准确度低问题,样本分布不平衡造成分类准确度低的问题;有效解决样本仓库更新困难问题,极大地降低样本仓库更新成本。更新成本。更新成本。

【技术实现步骤摘要】
基于级联均值向量综合评分的图片多级分类方法及系统


[0001]本专利技术涉及图像分类领域,尤其涉及一种基于级联均值向量综合评分的图片多级分类方法及系统。

技术介绍

[0002]在基层社会治理工作开展过程中,网格员在进行巡查走访、基础数据采集、信息上报、矛盾纠纷排查调解等问题上报时,需要填写事件类型,事件类型常常表现为多级级联分类,且以三级分类最为常见。基层社会治理的事件类别多、分类细,以深圳南山区为例,事件可分为二十几个一级分类、五十几个二级分类和三百多个三级分类,这使得网格员难以快速地、准确地选定事件类型,而准确的事件分类是后续事件分拨、下派工作展开的重要保障。在网格员事件上报过程中,结合网格员拍摄的事件发生地的代表性照片,进行事件智能多级分类,是一种提高网格员事件上报效率、降低人工误差的新技术方案。除此以外,图片多级分类在新闻图片多级分类、植物花卉多级分类等多个领域均具备直接或间接的应用价值。
[0003]目前较为主流的图片多级分类方法主要分为“机器学习分类模型法”、“图片特征向量搜索法”两种。
[0004]对于“图片特征向量搜索法”,这种方法直接搜索与待分类图片的特征向量距离最近的特征向量,以此特征向量的多级分类标签作为待分类图片的多级分类结果,这种“直接分类方法”未考虑类间的亲疏性,分类结果易混淆。
[0005]对于“机器学习分类模型法”,无论采取何种分类模型,在构建训练样本集时,都要求样本分布均衡,分布不均衡的样本将影响分类模型准确度,分类结果将更偏向于训练样本数目更多的类别。/>[0006]上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。

技术实现思路

[0007]本专利技术的主要目的在于,解决现有技术中,未考虑类间的亲疏性导致分类结果易混淆,以及分布不均衡的样本将影响分类模型准确度的技术问题。
[0008]为实现上述目的,本专利技术提供一种基于级联均值向量综合评分的图片多级分类方法,包括:S1:获取样本图片集合,通过所述样本图片集合构建样本图片特征向量集合,所述样本图片特征向量集合包括个特征类别;S2:计算所述样本图片特征向量集合中各所述特征类别的均值向量,获得均值向量集合;S3:获取待分类图片,提取所述待分类图片的待分类图片特征向量;
S4:迭代计算所述待分类图片特征向量与所述均值向量集合中各所述特征类别的均值向量之间的欧式距离,获得欧式距离集合;S5:通过所述欧式距离集合计算获得所述待分类图片的分类结果。
[0009]优选地,步骤S1具体为:S11:采集多张社区事件图片,将所述社区事件图片作为样本图片,获得所述样本图片集合;S12:获取所述样本图片集合的特征类别;其中,i表示样本图片的级,0<i≤n,n表示级的总个数;j
i
表示样本图片在i级对应的类,0<j
i
≤m
i
,m
i
表示在i级对应的类的总个数;S13:通过训练好的深度卷积神经网络,获取各所述特征类别对应的所有样本图片的特征向量,经过归一化处理后获得所述样本图片特征向量集合。
[0010]优选地,步骤S2具体为:S21:将某一特征类别对应的个样本图片特征向量的均值,作为该特征类别的均值向量;S22:重复步骤S21共次,计算获得所有特征类别对应的均值向量,将所有的均值向量的集合作为所述均值向量集合。
[0011]优选地,步骤S4具体为:所述均值向量集合共包括个所述均值向量,依次计算所述待分类图片特征向量与各所述特征类别的均值向量之间的欧式距离,共获得个欧式距离,将所有的欧式距离的集合作为所述欧式距离集合,其中特征类别与的标号依次对应。
[0012]优选地,步骤S5具体为:S51:通过所述欧式距离集合计算获得各所述特征类别对应的归一化评分;S52:通过各所述归一化评分,计算获得各所述特征类别在不同级之间的级联评分S53:通过所述级联评分,计算特征类别至特征类别的级联分类综合
评分,计算公式如下:其中计算值最大的级联分类综合评分对应的分类结果,为所述待分类图片概率最大的分类结果。
[0013]优选地,步骤S51中,所述归一化评分的计算公式如下:其中,表示第i级所有分类的均值向量与待分类图片特征向量的欧式距离最小值,表示第i级所有分类的均值向量与待分类图片特征向量的欧式距离最大值。
[0014]优选地,步骤S52具体为:S521:获取第a+1级前20%分类结果中第a级第b类对应的a+1级子分类的归一化评分之和,获取第a+1级前20%分类结果中第a级第b类对应的a+1级子分类的数目;S522:第a级第b类的级联评分的计算公式如下:其中,0<a<n;0<b<m;当a=n;b=m时,;S523:重复步骤S521

S522共次,获得所有的级联评分。
[0015]一种基于级联均值向量综合评分的图片多级分类系统,包括:特征类别获取模块,用于获取样本图片集合,通过所述样本图片集合构建样本图片特征向量集合,所述样本图片特征向量集合包括个特征类别;均值向量集合获取模块,用于计算所述样本图片特征向量集合中各所述特征类别的均值向量,获得均值向量集合;特征向量提取模块,用于获取待分类图片,提取所述待分类图片的待分类图片特征向量;欧式距离计算模块,用于迭代计算所述待分类图片特征向量与所述均值向量集合中各所述特征类别的均值向量之间的欧式距离,获得欧式距离集合;分类结果获取模块,用于通过所述欧式距离集合计算获得所述待分类图片的分类结果。
[0016]本专利技术具有以下有益效果:1、提高多级分类准确度,有效解决包括未考虑类间亲疏性所造成的分类准确度低
问题,样本分布不平衡造成分类准确度低的问题;2、有效解决样本仓库更新困难问题,极大地降低样本仓库更新成本。
附图说明
[0017]图1为本专利技术实施例方法流程图;图2为本专利技术实施例系统结构图;本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0018]应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0019]参照图1,本专利技术提供一种基于级联均值向量综合评分的图片多级分类方法,包括:S1:获取样本图片集合,通过所述样本图片集合构建样本图片特征向量集合,所述样本图片特征向量集合包括个特征类别;S2:计算所述样本图片特征向量集合中各所述特征类别的均值向量,获得均值向量集合;S3:获取待分类图片,提取所述待分类图片的待分类图片特征向量;S4:迭代计算所述待分类图片特征向量与所述均值向量集合中各所述特征类别的均值向量之间的欧式距离,获得欧式距离集合;S5:通过所述欧式距离集合计算获得所述待分类图片的分类结果。
[0020]本实施例中,步骤S1具体为:S11:采集多张社区事件图片,将所述社区事件图片作为样本图片,获得所述样本图片集合;共选取157398张社区事件图片;S12:获取所述样本图片集合的特征类别;其中,i表示样本图片的级本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于级联均值向量综合评分的图片多级分类方法,其特征在于,包括:S1:获取样本图片集合,通过所述样本图片集合构建样本图片特征向量集合,所述样本图片特征向量集合包括个特征类别;其中,i表示样本图片的级,0<i≤n,n表示级的总个数;j
i
表示样本图片在i级对应的类,0<j
i
≤m
i
,m
i
表示在i级对应的类的总个数;S2:计算所述样本图片特征向量集合中各所述特征类别的均值向量,获得均值向量集合;S3:获取待分类图片,提取所述待分类图片的待分类图片特征向量;S4:迭代计算所述待分类图片特征向量与所述均值向量集合中各所述特征类别的均值向量之间的欧式距离,获得欧式距离集合;S5:通过所述欧式距离集合计算获得所述待分类图片的分类结果。2.根据权利要求1所述的基于级联均值向量综合评分的图片多级分类方法,其特征在于,步骤S1具体为:S11:采集多张社区事件图片,将所述社区事件图片作为样本图片,获得所述样本图片集合;S12:获取所述样本图片集合的特征类别;S13:通过训练好的深度卷积神经网络,获取各所述特征类别对应的所有样本图片的特征向量,经过归一化处理后获得所述样本图片特征向量集合。3.根据权利要求1所述的基于级联均值向量综合评分的图片多级分类方法,其特征在于,步骤S2具体为:S21:将某一特征类别对应的个样本图片特征向量的均值,作为该特征类别的均值向量;S22:重复步骤S21共次,计算获得所有特征类别对应的均值向量,将所有的均值向量的集合作为所述均值向量集合。4.根据权利要求1所述的基于级联均值向量综合评分的图片多级分类方法,其特征在于,步骤S4具体为:所述均值向量集合共包括个所述均值向量,依次计算所述待分类图片特征
向量与各所述特征类别的均值向量之间的欧式距离,共获得个欧式距离,将所有的欧式距离的集合作为所述欧式距离集合,其中特征类别与的标号依次对应。5.根据权利要求1...

【专利技术属性】
技术研发人员:朱毅雷振陈胜鹏李飞李颖
申请(专利权)人:武大吉奥信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1