当前位置: 首页 > 专利查询>华侨大学专利>正文

一种基于PaddleDetection的混淆矩阵生成方法技术

技术编号:32514923 阅读:14 留言:0更新日期:2022-03-02 11:07
本发明专利技术提供了一种基于PaddleDetection的混淆矩阵生成方法,包括:在PaddlePaddle平台下运用PaddleDetection目标检测开发套件训练目标检测网络;获取有标注的测试数据集,分为两个文件夹,一个文件夹放json文件,另一个放对应的图片文件,并得到真实的目标物体外接矩形框;运用infer.py图片文件进行预测,得到预测标签;得出预测修正得到的矩形检测框;将真实矩形框与预测修正得到的矩形检测框进行循环匹配,将统计得到的值记录在矩阵上;创建excle表格,将记录的矩阵填充到excle表格中,绘制出用于评价模型实际应用效果的混淆矩阵,本发明专利技术方法能通过目标检测网络预测的检测框与实际的目标检测框进行匹配,绘制在混淆矩阵上,以便对于模型各个种类的识别结果进行统计研究,优化网络模型的训练方法。优化网络模型的训练方法。优化网络模型的训练方法。

【技术实现步骤摘要】
一种基于PaddleDetection的混淆矩阵生成方法


[0001]本专利技术涉及深度学习目标检测领域,特别是指一种基于PaddleDetection的混淆矩阵生成方法。

技术介绍

[0002]飞桨(PaddlePaddle)是集深度学习核心框架、工具组件和服务平台为一体的百度自主研发的开源深度学习平台。PaddleDetection是飞桨深度学习平台下的优秀的目标检测开发套件,提供多种主流目标检测、实例分割、关键点检测算法,并且将各个网络组件进行模块化、提供数据增强策略、损失函数策略等,模型的压缩和跨平台的的高性能部署能够帮助工业项目更好的完成落地。
[0003]对于目标检测而言,检测识别的准确率很大程度上取决于模型本身的识别精度,因此前期在对神经网络识别模型进行训练的时候需要找到一个合适的适合实际生产的评价指标。在PaddleDetection套件中评价神经网络模型评价指标是通过mAP来进行评价,不能反应实际分拣中的各个类别的识别精度。
[0004]混淆矩阵(Confusion Matrix)也称误差矩阵,用n行n列的矩阵来表示。在人工智能图像分类精度的评价中,主要用于比较分类结果和实际测得的值。混淆矩阵的每一列代表了预测类别,每一列的总数表示预测为该类别的数据的数目;每一行代表了数据的真实归属类别,每一行的数据总数表示该类别的数据实例的数目。每一列中的数值表示真实数据被预测为该类的数目.如图1所示,第一行第一列中的96表示有96个实际归属第一类的实例被预测为第一类,同理,第一行第二列的2表示有2个实际归属为第一类的实例被错误预测为第二类,依次类推。

技术实现思路

[0005]本专利技术的主要目的在于克服现有技术中的上述缺陷,提出一种基于PaddleDetection的混淆矩阵生成方法,能通过目标检测网络预测的检测框与实际的目标检测框进行匹配,将匹配的实际结果记录下来,绘制在混淆矩阵上,以便对于模型各个种类的识别结果进行统计研究,优化网络模型的训练方法。
[0006]本专利技术采用如下技术方案:
[0007]步骤一,在PaddlePaddle平台下运用PaddleDetection目标检测开发套件训练一个目标检测网络。
[0008]步骤二,准备一批新的有标注的测试数据集,分为两个文件夹,一个文件夹放json文件,另一个放对应的图片文件。运用openCV的rect函数对json文件下的轮廓标签进行处理可以得到真实的目标物体外接矩形框;
[0009]步骤三,运用PaddleDetection开发套件下的infer.py对步骤二中的图片文件进行预测,得到预测标签;
[0010]步骤四,以图片文件的数量i来循环遍历,利用模型对每张图片进行预测,得到图
片中每个物体的检测框,对物体的检测框进行iou判断,对于同类且iou大于阈值的检测框删除其他的框,仅保留置信度得分最高的检测框、对于不同类的且iou大于阈值的,只保留一个检测框,其他的删除,并把相应的标签改为others,由此便可以得到预测修正后的矩形检测框;
[0011]步骤五,将步骤二得出的真实的目标物体外接矩形框与步骤四预测修正得到的矩形检测框进行循环匹配,将统计得到的值记录在矩阵上;
[0012]步骤六,创建excle表格,将步骤五得出的矩阵填充到表格中,绘制出用于评价模型实际应用效果的混淆矩阵。
[0013]由上述对本专利技术的描述可知,与现有技术相比,本专利技术具有如下有益效果:
[0014](1)本专利技术提出一种基于PaddleDetection的混淆矩阵生成方法,能通过目标检测网络预测的检测框与实际的目标检测框进行匹配,将匹配的实际结果记录下来,绘制在混淆矩阵上,以便对于模型各个种类的识别结果进行统计研究,优化网络模型的训练方法。
附图说明
[0015]图1为混淆矩阵的示例图;
[0016]图2为本专利技术实施例中iou的计算方法;
[0017]图3为本专利技术实施例中删除目标检测预测的重叠框的示意图;
[0018]图4为本专利技术实施例中匹配预测框与真实框的程序流程示意图;
[0019]图5为本专利技术实施例得出的混淆矩阵示意图。
[0020]以下结合附图和具体实施例对本专利技术作进一步详述。
具体实施方式
[0021]本专利技术提出一种基于PaddleDetection的混淆矩阵生成方法,用于评价神经网络模型对实际目标检测的识别效果,所述神经网络为包括Mask-RCNN在内的目标检测网络;本专利技术提供的方法能通过目标检测网络预测的检测框与实际的目标检测框进行匹配,将匹配的实际结果记录下来,绘制在混淆矩阵上,以便我们对于模型各个种类的识别结果进行统计研究,优化网络模型的训练方法。
[0022]本专利技术具体实施例以生活垃圾后端分选的实际工况为例。采集的图片数据为生活垃圾低值可回收物在传送带上的图片,运用labelme对图片数据进行标注,将图片中的目标物体分为十个类别,包括Trans_HDPE、Color_HDPE、White_HDPE、Trans_PP、White_PP、Black_PP、Color_PP、Trans_PET、Bottle_PET、Others。
[0023]参照图2、图3、图4、图5具体步骤如下:
[0024]步骤一,采集并标注生活垃圾低值可回收物数据集12000张,80%划为训练集和20%验证集。使用GPU进行训练,计算机配置为Windows10,Intel(R)i5-10400F CPU,NVIDIA GeForce GTX3090显卡,24G显存,平台为PaddlePaddle。使用PaddleDetection 2.0版本开发套件静态版本中的Mask_RCNN神经网络模型,训练的初始学习率为0.00125,最大迭代步数max_iters为48000步,训练得到目标检测网络模型;
[0025]步骤二,准备一批新的有标注的测试数据集,分为两个文件夹,一个文件夹放json文件,另一个放对应的图片文件;json文件为通过labelme标注生成的json文件,里面记录
每个目标物体的种类及位置信息等。运用openCV的rect函数对json文件下的轮廓标签进行处理可以得到真实的目标物体外接矩形框。
[0026]步骤三,以步骤二中图片文件的数量i来循环遍历,利用步骤一训练得到的目标检测模型导出并在PaddleDetection2.0开发套件下执行infer.py对步骤二中的每张图片进行预测,将会得到np_boxes的列表,每一个np_boxes包含图片中每个物体的矩形检测框、类别、置信度。
[0027]步骤四,由于工况复杂的情况下,神经网络模型预测存在复选框和重叠框,会对最终检测精度的统计造成影响,因此需要对预测框进行修正。预测框位置可能与实际框存在微小的差别,经过实验统计预测框与实际框的iou值大于0.7即认为两个框试重合的,因此设iou阈值为0.7。
[0028]图片中每个目本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于PaddleDetection的混淆矩阵生成方法,其特征在于,包括以下步骤:步骤一,在PaddlePaddle平台下运用PaddleDetection目标检测开发套件训练目标检测网络;步骤二,获取有标注的测试数据集,分为两个文件夹,一个文件夹存放json文件,另一个存放对应的图片文件;运用openCV的rect函数对json文件下的轮廓标签进行处理可以得到真实的目标物体外接矩形框;步骤三,运用PaddleDetection开发套件下的infer.py对步骤二中的图片文件进行预测,得到预测标签;步骤四,以图片...

【专利技术属性】
技术研发人员:陈伟鑫杨建红房怀英林柏宏杨天成李建涛计天晨陈强杨宇轩谭国亿
申请(专利权)人:华侨大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1