一种领域图片细粒度分类识别方法及系统技术方案

技术编号：34692620 阅读：14 留言：0更新日期：2022-08-27 16:27

本发明专利技术涉及一种领域图片细粒度分类识别方法，首先基于训练集训练好三个能力互补的细粒度分类深度神经网络，然后对输入图片利用这三个深度神经网络分别进行分类，最后综合得到最终分类识别结果。本发明专利技术还涉及一种领域图片细粒度分类识别系统，包括处理中心和显示器，处理中心与所述显示器通讯连接；处理中心包括高清摄像头、预处理器、计算中心及存储器。本发明专利技术涉及科学合理，采用基于深度学习的神经网络识别方法，比传统方法的识别类别更多，速度更快，准确率更高，可以在短时间内对大批量同领域图片做出相对精准的细分类；同时节省了大量的人力资源及成本，且便于部署和移植。且便于部署和移植。且便于部署和移植。

全部详细技术资料下载

【技术实现步骤摘要】
一种领域图片细粒度分类识别方法及系统

[0001]本专利技术属于模式识别
，具体涉及一种领域图片细粒度分类识别方法及系统。

技术介绍

[0002]细粒度图片分类是对大类下的子类进行识别，细粒度图片分析任务相对通用图片任务的区别和难点在于其图片所属类别的粒度更为精细。由于分类的粒度很小，细粒度图片分类非常困难，在某些类别上甚至专家都难以区分。主要原因有三：子类之间差异细微；子类内部差异巨大；受视角、背景、遮挡等因素影响较大。
[0003]现有的各种细粒度图片分类方法存在以下问题：(1)特征描述能力弱，区分能力不够。(2)对局部信息不够重视。(3)很多算法严重依赖于人工标注信息，无法实际应用。
[0004]对某个领域的图片进行进一步细粒度分类识别，目前尚缺乏真正有效的装置或者系统。通常只能由相关专业人员进行肉眼辨别。除了人工方法，若直接采用一般的图片分类神经网络模型，则分类性能很差，无法实用。
[0005]因此，现有对同领域图片进行细粒度分类识别的技术缺点在于：第一，人工方法所需要的成本很高；第二，人工方法效率低下；第三，人工方法难以开展大批量领域图片的分类工作；第四，一般的深度学习图片分类模型无法完成细粒度图片的分类识别。

技术实现思路

[0006]本专利技术的目的在于克服现有技术的不足，提供一种领域图片细粒度分类识别方法及系统，首先基于训练集训练好三个能力互补的细粒度分类深度神经网络，然后对输入图片利用这三个深度神经网络分别进行分类，最后综合得到最终分类识别结果。
>[0007]本专利技术解决其技术问题是通过以下技术方案实现的：
[0008]一种领域图片细粒度分类识别方法，其特征在于：所述方法融合三种深度神经网络进行领域图片细粒度分类识别，首先基于训练集训练好三个能力互补的细粒度分类深度神经网络，然后对输入图片利用这三个深度神经网络分别进行分类，最后综合得到最终分类识别结果，所述方法的步骤为：
[0009]1)输入若干类待细分的同领域图片，并将这些图片每个子类按文件夹存放，生成训练集；
[0010]2)利用步骤1)生成的训练集分别对NTS
‑
Net、MMAL
‑
Net、PMG
‑
Net三个模型进行训练；
[0011]3)利用高清摄像头采集领域图片并输入到预处理器中或者将已有领域图片输入到预处理器中；
[0012]4)预处理器接收步骤3)的领域图片并进行图片预处理，生成预处理后的领域图片；
[0013]5)将步骤4)生成的领域图片送入含有已训练好的深度神经网络NTS
‑
Net、MMAL
‑
Net和PMG
‑
Net的计算中心，输出每个神经网络下的领域图片分类识别结果及置信度；
[0014]6)对步骤5)中三个神经网络输出的领域图片分类识别结果及置信度进行综合处理，得到最终的识别结果和置信度送到存储器中，存储器接收所述识别结果进行存储并向显示器提供显示的内容。
[0015]而且，所述步骤1)中的同领域图片是细粒度的，包含了同领域的不同子类。
[0016]而且，所述步骤4)中对图片的预处理包括对高清摄像头偶然情况采集到的错误图片使用算法进行剔除、对存在拖影的图片合成重构为清晰图片及图片分辨率调整。
[0017]而且，所述步骤5)中的深度神经网络NTS
‑
Net包含三个模块，分别为Navigator模块、Teacher模块及Scrutinizer模块，深度神经网络NTS
‑
Net使Navigator模块能够在Teacher模块的指导下检测到图片中最具判别性的区域，然后Scrutinizer模块仔细检查这些区域并做出预测。
[0018]而且，所述步骤5)中的深度神经网络MMAL
‑
Net具有3个分支，分别为学习图片中目标的总体特征、定位图片中目标的边框信息及图片中目标的局部特征。
[0019]而且，所述步骤5)中的深度神经网络PMG
‑
Net通过两个相互协同工作的组件实现，一方面用渐进的训练策略有效地融合来自不同粒度的特征；另一方面用随机jigsaw patch生成器，鼓励网络在特定粒度学习特征。
[0020]而且，所述步骤6)中综合处理的标准为若置信度prob高于设定的阈值则图片存储至文件夹A下，若置信度prob不高于设定的阈值则图片存储至待人工处理文件夹下。
[0021]一种领域图片细粒度分类识别系统，其特征在于：包括处理中心和显示器，所述处理中心与所述显示器通讯连接，所述处理中心获取领域图片处理后传输给所述显示器进行输出显示；所述处理中心包括高清摄像头、预处理器、计算中心及存储器，所述高清摄像头执行采集领域图片并输入所述预处理器中，所述预处理器接收所述领域图片后对图片进行预处理生成预处理后的领域图片，所述预处理后的领域图片被传输给所述计算中心；所述计算中心对所述预处理后的领域图片进行识别输出识别结果给所述存储器；所述存储器接收所述识别结果进行存储并且向所述显示器提供显示的内容。
[0022]本专利技术的优点和有益效果为：
[0023]本专利技术通过工业高清摄像头拍摄未知子类的领域目标照片，传入已部署本系统的计算中心，经过含有各种不同子类领域图片数据集充分训练后的三个神经网络模型冗余判别，在几秒钟内对图片所属的子类给出识别结果，识别准确率近乎百分九十以上；对比传统的人工肉眼识别，本专利技术可以在短时间内，对大批量领域图片做出相对精准判别，分别识别效率高，精度强，大大节省相关成本的消耗。
附图说明
[0024]图1为本专利技术方法的整体原理拓扑图；
[0025]图2为本专利技术方法的流程图；
[0026]图3为本专利技术深度神经网络NTS
‑
Net模型包含Navigator和Teacher模块的训练原理示意图；
[0027]图4为本专利技术深度神经网络NTS
‑
Net模型包含Navigator和Scrutinizer模块的分类原理示意图；
[0028]图5为本专利技术深度神经网络MMAL
‑
Net的原理示意图；
[0029]图6为本专利技术系统的拓扑原理图；
[0030]图7为本专利技术以飞机型号识别为例的细粒度分类识别系统的流程图。
具体实施方式
[0031]下面通过具体实施例对本专利技术作进一步详述，以下实施例只是描述性的，不是限定性的，不能以此限定本专利技术的保护范围。
[0032]本专利技术提供的一种领域图片细粒度分类识别方法的整体原理拓扑图如图1所示，基本过程如下：
[0033]输入若干子类待细分同领域图片，每个子类图片按文件夹存放，生成数据集；三个能力互补的神经网络模型在所述数据集上训练生成充分训练的模型；
[0034]将测试图片输入充分训练的模型进行运算处理，对三个神经网络输出结果进行综合，输出的综本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种领域图片细粒度分类识别方法，其特征在于：所述方法融合三种深度神经网络进行领域图片细粒度分类识别，首先基于训练集训练好三个能力互补的细粒度分类深度神经网络，然后对输入图片利用这三个深度神经网络分别进行分类，最后综合得到最终分类识别结果，所述方法的步骤为：1)输入若干类待细分的同领域图片，并将这些图片每个子类按文件夹存放，生成训练集；2)利用步骤1)生成的训练集分别对NTS
‑
Net、MMAL
‑
Net、PMG
‑
Net三个模型进行训练；3)利用高清摄像头采集领域图片并输入到预处理器中或者将已有领域图片输入到预处理器中；4)预处理器接收步骤3)的领域图片并进行图片预处理，生成预处理后的领域图片；5)将步骤4)生成的领域图片送入含有已训练好的深度神经网络NTS
‑
Net、MMAL
‑
Net和PMG
‑
Net的计算中心，输出每个神经网络下的领域图片分类识别结果及置信度；6)对步骤5)中三个神经网络输出的领域图片分类识别结果及置信度进行综合处理，得到最终的识别结果和置信度送到存储器中，存储器接收所述识别结果进行存储并向显示器提供显示的内容。2.根据权利要求1所述的领域图片细粒度分类识别方法，其特征在于：所述步骤1)中的同领域图片是细粒度的，包含了同领域的不同子类。3.根据权利要求1所述的领域图片细粒度分类识别方法，其特征在于：所述步骤4)中对图片的预处理包括对高清摄像头偶然情况采集到的错误图片使用算法进行剔除、对存在拖影的图片合成重构为清晰图片及图片分辨率调整。4.根据权利要求1所述的领域图片细粒度分类识别方法，其特征在于：所述步骤5)中的深度神经网络NTS
‑
Net包含三个模块...

【专利技术属性】
技术研发人员：康广玉，葛云涛，张建勋，王悦，赵坚，苏刚，罗春丽，刘进军，郭福雁，潘雷，王贝贝，李艳君，崔闻珊，任权昌，陆哲明，
申请(专利权)人：天津城建大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人