图像识别方法和装置制造方法及图纸

技术编号:24252118 阅读:57 留言:0更新日期:2020-05-22 23:52
本发明专利技术公开了一种图像识别方法和装置。其中,该方法包括:对待识别图像进行分割处理,得到若干子图像;依据预设比例对若干子图像进行扩充处理,以确保待识别图像中的目标对象完整的出现在某个子图像中;使用训练好的深度卷积神经网络对若干子图像和待识别图像进行检测;将若干子图像和待识别图像的检测结果进行合并处理,以确定待识别图像中所识别出的目标对象的相关信息,其中,相关信息包括至少以下任意之一:目标对象在待识别图像中的标识标志、目标对象的地理坐标。本发明专利技术解决了主流目标检测算法对于小目标的检测效果很差,极容易出现漏检现象的技术问题。

Image recognition method and device

【技术实现步骤摘要】
图像识别方法和装置
本专利技术涉及图像识别领域,具体而言,涉及一种图像识别方法和装置。
技术介绍
输电杆塔有分布范围广、所处地理位置和气候复杂、破坏因素多等特点。近年来,国家不断加大对农村道路和房屋的建设,不可避免的使得大型建筑机械在输电通道附近活动,使得工程机械违章施工造成的输电杆塔故障大量增多。近年来,随着国家电网提出的“坚强智能电网”发展规划,各种新的技术和设备不断引入用于对相关设施进行巡检和预警,主要依靠于不同类型的模式识别技术。与本专利技术最相近似的现有技术方案:现在主流的目标检测算法,分为一阶段算法如yolo、centernet等,和二阶段算法如fasterrcnn等。这些算法性能较好,在各行业的图像目标识别领域有着广泛的应用,但都有一个问题:对于小目标的检测效果很差,极容易出现漏检现象。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种图像识别方法和装置,以至少解决主流目标检测算法对于小目标的检测效果很差,极容易出现漏检现象的技术问题。根据本专利技术实施例的一个方面,提供了一种图像识别方法,包括:对待识别图像进行分割处理,得到若干子图像;依据预设比例对所述若干子图像进行扩充处理,以确保所述待识别图像中的目标对象完整的出现在某个子图像中;使用训练好的深度卷积神经网络对所述若干子图像和所述待识别图像进行检测;将所述若干子图像和所述待识别图像的检测结果进行合并处理,以确定所述待识别图像中所识别出的目标对象的相关信息,其中,所述相关信息包括至少以下任意之一:所述目标对象在所述待识别图像中的标识标志、所述目标对象的地理坐标。可选地,对待识别图像进行分割处理,得到若干子图像,包括:依据预设行和预设列对所述待识别图像进行分割处理,得到m*n个子图像。可选地,在使用训练好的深度卷积神经网络对所述若干子图像进行识别处理之前,所述方法还包括:至少确定深度卷积神经网络的层数、卷积核大小与个数;获取多种天气场景下有目标对象的第一图片和多种天气场景下无目标对象的第二图片,并对所述第一图片和所述第二图片进行标注处理,以区分所述图片有无目标对象;将获取到的图片随机划分为训练数据和验证数据,并通过所述训练数据和所述验证数据对所述深度卷积神经网络进行训练验证处理,得到训练好的深度卷积神经网络。可选地,通过所述训练数据和所述验证数据对所述深度卷积神经网络进行训练验证处理,包括:对所述训练数据进行分割预处理,并使用分割预处理后的训练数据对所述深度卷积神经网络进行训练,得到初始深度卷积神经网络模型和其对应参数;使用验证数据对所述初始深度卷积神经网络模型和其对应参数进行验证处理,得到训练好的深度卷积神经网络。可选地,对所述训练数据进行分割预处理,包括:依据图片分辨率将所述图片分割为多个子图,其中,所述多个子图中包括至少以下任意之一:含有目标对象的第一子图、不含有目标对象的第二子图;计算每个第一子图与其包含的目标对象之间的重叠度,其中,计算公式如下:重叠度=第一子图框∩目标对象框/第一子图框∪目标对象框;在每个目标对象对应的至少一个第一子图中,确定重叠度最大的目标子图;对每个目标子图进行图框范围修改,以确保所述目标子图所包含的目标对象完整的显示于所述目标子图中;将所述目标子图和其他子图中的无效对象涂抹掉,并保留所述目标对象;并使用经过涂抹处理后的目标子图和其他子图重新制作为训练数据,并对所述训练数据进行参数化处理。根据本专利技术实施例的另一方面,还提供了一种图像识别装置,包括:分割单元,用于对待识别图像进行分割处理,得到若干子图像;扩充单元,用于依据预设比例对所述若干子图像进行扩充处理,以确保所述待识别图像中的目标对象完整的出现在某个子图像中;检测单元,用于使用训练好的深度卷积神经网络对所述若干子图像和所述待识别图像进行检测;合并单元,用于将所述若干子图像和所述待识别图像的检测结果进行合并处理,以确定所述待识别图像中所识别出的目标对象的相关信息,其中,所述相关信息包括至少以下任意之一:所述目标对象在所述待识别图像中的标识标志、所述目标对象的地理坐标。可选地,所述分割单元包括:分割子单元,用于依据预设行和预设列对所述待识别图像进行分割处理,得到m*n个子图像。可选地,所述装置还包括:确定单元,用于在使用训练好的深度卷积神经网络对所述若干子图像进行识别处理之前,至少确定深度卷积神经网络的层数、卷积核大小与个数;获取单元,用于获取多种天气场景下有目标对象的第一图片和多种天气场景下无目标对象的第二图片,并对所述第一图片和所述第二图片进行标注处理,以区分所述图片有无目标对象;训练单元,用于将获取到的图片随机划分为训练数据和验证数据,并通过所述训练数据和所述验证数据对所述深度卷积神经网络进行训练验证处理,得到训练好的深度卷积神经网络。可选地,所述训练单元包括:训练子单元,用于对所述训练数据进行分割预处理,并使用分割预处理后的训练数据对所述深度卷积神经网络进行训练,得到初始深度卷积神经网络模型和其对应参数;验证子单元,用于使用验证数据对所述初始深度卷积神经网络模型和其对应参数进行验证处理,得到训练好的深度卷积神经网络。可选地,所述训练子单元包括:分割模块,用于依据图片分辨率将所述图片分割为多个子图,其中,所述多个子图中包括至少以下任意之一:含有目标对象的第一子图、不含有目标对象的第二子图;计算模块,用于计算每个第一子图与其包含的目标对象之间的重叠度,其中,计算公式如下:重叠度=第一子图框∩目标对象框/第一子图框∪目标对象框;确定模块,用于在每个目标对象对应的至少一个第一子图中,确定重叠度最大的目标子图;修改模块,用于对每个目标子图进行图框范围修改,以确保所述目标子图所包含的目标对象完整的显示于所述目标子图中;涂抹模块,用于将所述目标子图和其他子图中的无效对象涂抹掉,并保留所述目标对象;制作模块,用于并使用经过涂抹处理后的目标子图和其他子图重新制作为训练数据,并对所述训练数据进行参数化处理。在本专利技术实施例中,通过对待识别图像进行分割处理,得到若干子图像;依据预设比例对所述若干子图像进行扩充处理,以确保所述待识别图像中的目标对象完整的出现在某个子图像中;使用训练好的深度卷积神经网络对所述若干子图像和所述待识别图像进行检测;将所述若干子图像和所述待识别图像的检测结果进行合并处理,以确定所述待识别图像中所识别出的目标对象的相关信息,其中,所述相关信息包括至少以下任意之一:所述目标对象在所述待识别图像中的标识标志、所述目标对象的地理坐标,进而解决了主流目标检测算法对于小目标的检测效果很差,极容易出现漏检现象技术问题。也即,在本专利技术实施例中针对小目标识别,通过将待识别图像分割为多个子图像的方式进行检测,使得本专利技术提供到图像识别方法更适用于小目标检测,大幅度降低了误检率,提供了识别准确率。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附本文档来自技高网...

【技术保护点】
1.一种图像识别方法,其特征在于,包括:/n对待识别图像进行分割处理,得到若干子图像;/n依据预设比例对所述若干子图像进行扩充处理,以确保所述待识别图像中的目标对象完整的出现在某个子图像中;/n使用训练好的深度卷积神经网络对所述若干子图像和所述待识别图像进行检测;/n将所述若干子图像和所述待识别图像的检测结果进行合并处理,以确定所述待识别图像中所识别出的目标对象的相关信息,其中,所述相关信息包括至少以下任意之一:所述目标对象在所述待识别图像中的标识标志、所述目标对象的地理坐标。/n

【技术特征摘要】
1.一种图像识别方法,其特征在于,包括:
对待识别图像进行分割处理,得到若干子图像;
依据预设比例对所述若干子图像进行扩充处理,以确保所述待识别图像中的目标对象完整的出现在某个子图像中;
使用训练好的深度卷积神经网络对所述若干子图像和所述待识别图像进行检测;
将所述若干子图像和所述待识别图像的检测结果进行合并处理,以确定所述待识别图像中所识别出的目标对象的相关信息,其中,所述相关信息包括至少以下任意之一:所述目标对象在所述待识别图像中的标识标志、所述目标对象的地理坐标。


2.根据权利要求1所述的图像识别方法,其特征在于,对待识别图像进行分割处理,得到若干子图像,包括:
依据预设行和预设列对所述待识别图像进行分割处理,得到m*n个子图像。


3.根据权利要求1所述的图像识别方法,其特征在于,在使用训练好的深度卷积神经网络对所述若干子图像进行识别处理之前,所述方法还包括:
至少确定深度卷积神经网络的层数、卷积核大小与个数;
获取多种天气场景下有目标对象的第一图片和多种天气场景下无目标对象的第二图片,并对所述第一图片和所述第二图片进行标注处理,以区分所述图片有无目标对象;
将获取到的图片随机划分为训练数据和验证数据,并通过所述训练数据和所述验证数据对所述深度卷积神经网络进行训练验证处理,得到训练好的深度卷积神经网络。


4.根据权利要求3所述的图像识别方法,其特征在于,通过所述训练数据和所述验证数据对所述深度卷积神经网络进行训练验证处理,包括:
对所述训练数据进行分割预处理,并使用分割预处理后的训练数据对所述深度卷积神经网络进行训练,得到初始深度卷积神经网络模型和其对应参数;
使用验证数据对所述初始深度卷积神经网络模型和其对应参数进行验证处理,得到训练好的深度卷积神经网络。


5.根据权利要求4所述的图像识别方法,其特征在于,对所述训练数据进行分割预处理,包括:
依据图片分辨率将所述图片分割为多个子图,其中,所述多个子图中包括至少以下任意之一:含有目标对象的第一子图、不含有目标对象的第二子图;
计算每个第一子图与其包含的目标对象之间的重叠度,其中,计算公式如下:重叠度=第一子图框∩目标对象框/第一子图框∪目标对象框;
在每个目标对象对应的至少一个第一子图中,确定重叠度最大的目标子图;
对每个目标子图进行图框范围修改,以确保所述目标子图所包含的目标对象完整的显示于所述目标子图中;
将所述目标子图和其他子图中的无效对象涂抹掉,并保留所述目标对象;
并使用经过涂抹处理后的目标子图和其他子图重新制作为训练数据,并对所述训练数据进行参数化处理。


6.一种图像识别装置,其特征在于,包括:
分割单元,用于对待识别图像进行分割处理,得到若干子图像;
扩充单元,用于依据预设比例对所述若干子图像进行扩充处理,以确保所述待识别图像中的目标对象完整的出现...

【专利技术属性】
技术研发人员:李瑛耿军伟陈波韩俊龙武瑶李聪赵留学张嘉慧周爽白烁
申请(专利权)人:国网北京市电力公司国家电网有限公司北京电力经济技术研究院有限公司核芯互联科技青岛有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1