当前位置: 首页 > 专利查询>武汉大学专利>正文

支持检测未知类的城市垃圾增量学习检测方法及系统技术方案

技术编号:38253666 阅读:9 留言:0更新日期:2023-07-27 10:18
本发明专利技术提供一种支持检测未知类的城市垃圾增量学习检测方法及系统,在Faster

【技术实现步骤摘要】
支持检测未知类的城市垃圾增量学习检测方法及系统


[0001]本专利技术属于智能检测
,尤其涉及一种持续增量注册学习、能够检测未知类的城市垃圾检测、分类的新技术。

技术介绍

[0002]应用神经网络目标检测类方法来布控摄像头进行监测的技术已较为常见与成熟,其原理是以数据驱动,通过给模型补充大量成千上万的类别数据,以进行训练,即需要成千上万的类别实例训练,使得模型能够“认识”类别的新实例。
[0003]众所周知,现有深度学习方法的大量数据依赖性质是深度学习的缺陷所在。在具体问题上,对于识别特征统一的物体,该缺陷则不为明显。但当应用在特别多样复杂的检测事件上时,诸如专利CN 109598303(一种基于城市场景的垃圾检测方法)中利用基础Faster R

CNN方法进行垃圾检测,众所周知垃圾种类成百上千,同种垃圾又因性质,大小,颜色等因素而相异。诸如专利CN113963251(一种海洋生物检测方法)中同样存在类似问题,开发一套检测海洋生物的目标检测方法并不复杂,难点在于如何收集足够多种类的海洋生物数据,同时每类海洋生物拥有同类大数量样本来覆盖检测需求,但这显然是成本极高无法做到的。故上述专利技术均存在明显缺陷:
[0004](1)存在极多无法检测情况。对于很少标注或没有标注的垃圾类别,模型无法检测。对于场景特征复杂,垃圾受场景遮挡严重时,模型无法检测。
[0005](2)目前标注技术力实现垃圾检测数据集几乎不可能,成本过高。对于标注数据,需要大量(数量级为千或万)数据以支撑模型。市面上目前没有成熟的垃圾检测数据集,即使有数据量也极小。
[0006]专利CN 109598303的两个较为严重缺陷促使了本专利技术的产生。带来上述问题的根源即:垃圾该类物体包含类型过多,而深度学习又是数据驱动型方法。故本专利技术着眼于从该点出发,设计了拟解决上述两点问题的一种持续增量学习,并能够检测未知的城市垃圾的新方法。
[0007]可见,现有技术还缺乏实施效果满足需求的解决方案,本专利技术的提出具有重要实际意义。

技术实现思路

[0008]本专利技术所解决的技术问题在于提供一种持续增量学习并能够检测未知类别的城市垃圾检测新方法,以解决上述
技术介绍
中的缺点。
[0009]本专利技术提供一种支持检测未知类的城市垃圾增量学习检测方法,进行以下处理,
[0010]在Faster

RCNN检测模型基础上优化特征提取与特征利用,包括设置金字塔特征结构获得多尺度特征,而后对特征做通道注意力修正,通过修正突出图像特征重点区域,抑制不明显特征,获得垃圾检测基础模型;
[0011]在垃圾检测基础模型的基础上,建立可持续增量注册学习模型,包括基于元学习
进行梯度处理,设置新的梯度处理损失与蒸馏损失,建立参数更新策略,使得模型训练支持仅使用新数据而不接触旧数据,完成新类别注册,同时不对旧知识产生遗忘;
[0012]在可持续增量注册学习模型基础上,设置支持检测未知类别网络结构,包括训练时建立聚类损失,拟合能量函数,预测时使用能量函数及能量值结合参数矩阵分类头产生分类结果,以稳定地识别未知类别的城市垃圾;支持将未知输出结果作为补充,进行增量注册学习,实现闭环。
[0013]而且,优化特征提取与特征利用的实现方式如下,
[0014]对输入图像做卷积操作,自底向上提取五组尺度特征,体现在宽高缩减通道数提升,而后将各组特征自顶向下完成特征融合,体现在上采样与加和操作,将宽高恢复并与前一尺度特征融合;
[0015]对提取特征做通道注意力图修正,对特征实施全局均值与最值池化操作,利用共享MLP多层感知机连接不同维度信息,通过加和操作与激活函数生成注意力图,最终结合原始特征加权修正。
[0016]而且,建立可持续增量注册学习模型的实现方式如下,
[0017]采用可控制梯度的参数矩阵梯度下降替代链式求导常规梯度下降,在梯度下降中的参数约束将控制梯度下降方向;
[0018]将参数约束模块化,设置梯度处理层,通过维护存有数据集每个类别对应数目特征的特征池,设置梯度损失函数引导模型梯度下降兼顾所有类别;
[0019]知识蒸馏策略将过去时刻任务特征提取作为教师网络,当前增加新检测类别作为当前任务,围绕特征前后差异设置蒸馏损失,确保注册新类别数据时,不遗忘旧类别数据。
[0020]而且,模型识别未知类别的实现方式如下,
[0021]训练过程中将最终待检测输出特征构建对比聚类损失函数,通过维护每个类的特征向量中心来对比待检测特征与不同类别的距离,增加不同类间特征向量距离,聚拢同类特征向量;
[0022]学习能量函数将多维特征向量转化为标量,学习该标量与所属类别之间的匹配程度,所学模型的映射将判断一个未知特征向量是否属于未知类别;
[0023]并行使用参数矩阵的未知分类头,将特征进行归一化处理,设置有界稀疏的参数掩码矩阵,限定输出分布,保证输出类别稳定。
[0024]而且,识别出基础类垃圾时,采取机器提醒的方式通过向摄像头传输信号,要求垃圾产生行为停止;识别出未知类时,抓拍并提示人工处理,根据用户判读决定措施,同时将其纳入本专利技术的新一轮训练数据。
[0025]另一方面,本专利技术提供一种支持检测未知类的城市垃圾增量学习检测系统,用于实现如上所述的一种支持检测未知类的城市垃圾增量学习检测方法。
[0026]而且,包括处理器和存储器,存储器用于存储程序指令,处理器用于调用存储器中的存储指令执行如上所述的一种支持检测未知类的城市垃圾增量学习检测方法。
[0027]或者,包括可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序执行时,实现如上所述的一种支持检测未知类的城市垃圾增量学习检测方法。
[0028]总体而言,通过本专利技术所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
[0029](1)大幅减少无法检测情况,实现垃圾应检尽检:数据集中不存在的样本,模型也尝试尽可能识别,大幅减少无法检测情况,“未曾见过的垃圾”做为未知类,模型也能识别。
[0030](2)大幅减少数据标注需求:只需一定数量的数据完成初步模型训练,后续可通过检测结果与未知识别作为模型数据,向模型持续注册新检测类别,实现模型“增量学习”。
附图说明
[0031]图1是本专利技术实施例的内容(1)金字塔特征与通道注意力机制改进的特征使用示意图。
[0032]图2是本专利技术实施例的内容(2)基于元学习为检测模型添加增量学习模块示意图。
[0033]图3是本专利技术实施例的内容(3)设置聚类与能量函数计算为检测模型添加识别未知模块示意图。
[0034]图4是本专利技术实施例应用时的检测流程图。
[0035]图5是本专利技术实施例应用时的数据标注与收集示意图。
[0036]图6是本专利技术实施例模型架构示意图。
具体实施方式
[0037]以下结合附图和实施例详本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种支持检测未知类的城市垃圾增量学习检测方法,其特征在于,进行以下处理,在Faster

RCNN检测模型基础上优化特征提取与特征利用,包括设置金字塔特征结构获得多尺度特征,而后对特征做通道注意力修正,通过修正突出图像特征重点区域,抑制不明显特征,获得垃圾检测基础模型;在垃圾检测基础模型的基础上,建立可持续增量注册学习模型,包括基于元学习进行梯度处理,设置新的梯度处理损失与蒸馏损失,建立参数更新策略,使得模型训练支持仅使用新数据而不接触旧数据,完成新类别注册,同时不对旧知识产生遗忘;在可持续增量注册学习模型基础上,设置支持检测未知类别网络结构,包括训练时建立聚类损失,拟合能量函数,预测时使用能量函数及能量值结合参数矩阵分类头产生分类结果,以稳定地识别未知类别的城市垃圾;支持将未知输出结果作为补充,进行增量注册学习,实现闭环。2.根据权利要求1所述的一种支持检测未知类的城市垃圾增量学习检测方法,其特征在于:优化特征提取与特征利用的实现方式如下,对输入图像做卷积操作,自底向上提取五组尺度特征,体现在宽高缩减通道数提升,而后将各组特征自顶向下完成特征融合,体现在上采样与加和操作,将宽高恢复并与前一尺度特征融合;对提取特征做通道注意力图修正,对特征实施全局均值与最值池化操作,利用共享MLP多层感知机连接不同维度信息,通过加和操作与激活函数生成注意力图,最终结合原始特征加权修正。3.根据权利要求1所述的一种支持检测未知类的城市垃圾增量学习检测方法,其特征在于:建立可持续增量注册学习模型的实现方式如下,采用可控制梯度的参数矩阵梯度下降替代链式求导常规梯度下降,在梯度下降中的参数约束将控制梯度下降方向;将参数约束模块化,设置梯度处理层,通过维护存有数据集每个类别对应数目特征的特征池,设置梯度损失函数引导模型梯度下降兼顾所有类别;知识蒸馏策略将过去时刻任务特征提取作为...

【专利技术属性】
技术研发人员:涂志刚朱立远古昊张嘉旭谢伟李红艳
申请(专利权)人:武汉大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1