目标对象的识别方法和装置、存储介质、电子装置制造方法及图纸

技术编号:20567367 阅读:27 留言:0更新日期:2019-03-14 09:48
本发明专利技术公开了一种目标对象的识别方法和装置、存储介质、电子装置。其中,该方法包括:获取第一图像和第二图像,第一图像为在可见光下对目标场景拍摄得到的,第二图像为在红外线下对目标场景拍摄得到的;通过预测模型确定第一图像中像素点对应的预测红外强度值,模型是使用在可见光下拍摄的一组第三图像作为模型输入并使用在红外线下拍摄的一组第四图像作为模型输出进行训练得到的模型;获取第二图像中的像素点的实际红外强度值与第一图像中相同位置上的像素点对应的预测红外强度值之间的差值;确定第二图像中的差值大于第一阈值的像素点为目标场景中目标对象所在的像素点。本发明专利技术解决了相关技术中对目标对象的识别准确率较低的技术问题。

【技术实现步骤摘要】
目标对象的识别方法和装置、存储介质、电子装置
本专利技术涉及图像处理领域,具体而言,涉及一种目标对象的识别方法和装置、存储介质、电子装置。
技术介绍
运动目标检测是指在序列图像中检测出变化区域并将运动目标从背景图像中提取出来,通常情况下,目标分类、跟踪和行为理解等后处理过程仅仅考虑图像中对应于运动目标的像素区域,因此运动目标的正确检测与分割对于后期处理非常重要。然而,由于场景的动态变化,如天气、光照、阴影及杂乱背景干扰等的影响,使得运动目标的检测与分割变得相当困难。相关技术中的目标检测算法包括帧差法、背景差分法、光流法等,这些方法各有优缺点,传统帧差法的不足在于对环境噪声较为敏感,且不适用于运动目标的检测,背景差分法不足在于对动态场景的变化,如光照和外来无关事件的干扰等特别敏感。可见,相关技术中的方案并不能在存在场景的动态变化,如天气、光照、阴影及杂乱背景干扰等的情况下准确检测出目标对象。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种目标对象的识别方法和装置、存储介质、电子装置,以至少解决相关技术中对目标对象的识别准确率较低的技术问题。根据本专利技术实施例的一个方面,提供了一种目标对象的识别方法,包括:获取第一图像和第二图像,第一图像为在可见光下对目标场景拍摄得到的图像,第二图像为在红外线下对目标场景拍摄得到的图像;通过预测模型确定第一图像中的像素点对应的预测红外强度值,预测模型是使用在可见光下拍摄得到的一组第三图像作为模型输入并使用在红外线下拍摄得到的一组第四图像作为模型输出进行训练得到的模型,一组第三图像和一组第四图像是相同场景的图像;获取第二图像中的像素点的实际红外强度值与第一图像中相同位置上的像素点对应的预测红外强度值之间的差值;确定第二图像中的差值大于第一阈值的像素点为目标场景中目标对象所在的像素点。根据本专利技术实施例的另一方面,还提供了一种目标对象的识别装置,包括:第一获取单元,用于获取第一图像和第二图像,第一图像为在可见光下对目标场景拍摄得到的图像,第二图像为在红外线下对目标场景拍摄得到的图像;预测单元,用于通过预测模型确定第一图像中的像素点对应的预测红外强度值,预测模型是使用在可见光下拍摄得到的一组第三图像作为模型输入并使用在红外线下拍摄得到的一组第四图像作为模型输出进行训练得到的模型,一组第三图像和一组第四图像是相同场景的图像;第二获取单元,用于获取第二图像中的像素点的实际红外强度值与第一图像中相同位置上的像素点对应的预测红外强度值之间的差值;识别单元,用于确定第二图像中的差值大于第一阈值的像素点为目标场景中目标对象所在的像素点。根据本专利技术实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的方法。根据本专利技术实施例的另一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器通过计算机程序执行上述的方法。在本专利技术实施例中,采用自适应函数重建,能有效建立非线性的用于表示目标场景的背景的预测模型,能有效融合红外光与可见光信息,抑制阴影干扰与红外光环效应,能有效抑制背景杂波突显目标,可以解决相关技术中对目标对象的识别准确率较低的技术问题,进而达到在存在干扰的情况下仍然能够准确识别目标对象的技术效果。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的目标对象的识别方法的硬件环境的示意图;图2是根据本专利技术实施例的一种可选的目标对象的识别方法的流程图;图3是根据本专利技术实施例的一种可选的场景可见光图像的示意图;图4是根据本专利技术实施例的一种可选的场景红外图像的示意图;图5是根据本专利技术实施例的一种可选的场景目标对象的示意图;图6是根据本专利技术实施例的一种可选的场景目标对象的示意图;图7是根据本专利技术实施例的一种可选的预测模型的示意图;图8是根据本专利技术实施例的一种可选的预测结果的示意图;图9是根据本专利技术实施例的一种可选的目标对象的识别装置的示意图;以及图10是根据本专利技术实施例的一种终端的结构框图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。随着科技的发展、社会的进步、生活水平的提高,团体和个人的安防意识都在不断增强,视频监控系统也就得到了越来越广泛的应用,另外,在人工智能领域,人、动物等的智能识别也越来越普通;在监控领域、人工智能等领域中,并不能在存在场景的动态变化,如天气、光照、阴影及杂乱背景干扰等的情况下准确检测出目标对象。为了克服以上场景中存在的问题,根据本专利技术实施例的一方面,提供了一种目标对象的识别方法的方法实施例。可选地,在本实施例中,上述目标对象的识别方法可以应用于如图1所示的由服务器101和用户终端103所构成的硬件环境中。如图1所示,服务器101通过网络与终端103进行连接,上述网络包括但不限于:广域网、城域网或局域网(如物业内部网络、公司内部网络等),终端103为可进行拍摄可见光图像和红外光图像拍摄的终端,包括并不限定于可见光监控摄像机、红外光监控摄像机、具有摄像头的手机、具有摄像头的平板电脑等;服务器为用于进行监控视频存储和/或监控视频分析的设备。上述的硬件环境可以是银行、博物馆、交通道路、商业机构、军事机构、公安局、电力部门、厂矿部门、智能小区、空间探测机构等领域的安全监控、自动监控和远程监控系统的硬件环境,其中,终端可以为这些系统中的位于同一位置的高清摄像机和红外摄像机,服务器可以是位于系统中控室的服务器,以实现利用计算机实现智能的目标检测和目标跟踪。上述的硬件环境还可以是人工智能系统中硬件环境,终端可以为系统中飞行器等智能设备的可见光传感器、红外传感器,服务器可以是与飞行器通讯连接的互联网服务器。采用本申请的方法可以自动定位出在可视区域出现的对象。将本申请的方法应用于监控、人工智能等领域时,本专利技术实施例的目标对象的识别方法可以由监控、人工智能系统中的服务器101来执行,图2是根据本专利技术实施例的一种可选的目标对象的识别方法的流程图,如图2所示,该方法可以包括以下步骤:步骤S202,服务器获取第一图像和第二图像,第一图像为在可见光下对目标场景拍摄得到的图像,第二图像为在红外线下对目本文档来自技高网
...

【技术保护点】
1.一种目标对象的识别方法,其特征在于,包括:获取第一图像和第二图像,其中,所述第一图像为在可见光下对目标场景拍摄得到的图像,所述第二图像为在红外线下对所述目标场景拍摄得到的图像;通过预测模型确定所述第一图像中的像素点对应的预测红外强度值,其中,所述预测模型是使用在可见光下拍摄得到的一组第三图像作为模型输入并使用在红外线下拍摄得到的一组第四图像作为模型输出进行训练得到的模型,所述一组第三图像和所述一组第四图像是相同场景的图像;获取所述第二图像中的像素点的实际红外强度值与所述第一图像中相同位置上的像素点对应的预测红外强度值之间的差值;确定所述第二图像中的所述差值大于第一阈值的像素点为所述目标场景中目标对象所在的像素点。

【技术特征摘要】
1.一种目标对象的识别方法,其特征在于,包括:获取第一图像和第二图像,其中,所述第一图像为在可见光下对目标场景拍摄得到的图像,所述第二图像为在红外线下对所述目标场景拍摄得到的图像;通过预测模型确定所述第一图像中的像素点对应的预测红外强度值,其中,所述预测模型是使用在可见光下拍摄得到的一组第三图像作为模型输入并使用在红外线下拍摄得到的一组第四图像作为模型输出进行训练得到的模型,所述一组第三图像和所述一组第四图像是相同场景的图像;获取所述第二图像中的像素点的实际红外强度值与所述第一图像中相同位置上的像素点对应的预测红外强度值之间的差值;确定所述第二图像中的所述差值大于第一阈值的像素点为所述目标场景中目标对象所在的像素点。2.根据权利要求1所述的方法,其特征在于,通过预测模型确定所述第一图像中的像素点对应的预测红外强度值包括:将所述第一图像中的像素点的颜色值输入至所述预测模型;调用所述预测模型中的多种类型的预测函数,根据所述第一图像中的像素点的颜色值确定所述第一图像中相同位置上的像素点对应的预测红外强度值。3.根据权利要求2所述的方法,其特征在于,将所述第一图像中的像素点的颜色值输入至所述预测模型包括:在所述第一图像中的像素点的颜色类型不为基于生理特征的颜色类型的情况下,将所述第一图像中的像素点的颜色类型转换为基于生理特征的颜色类型;将进行颜色类型转换后的所述第一图像中的像素点的第一颜色通道的颜色值和第二颜色通道的颜色值输入至所述预测模型。4.根据权利要求1至3中任意一项所述的方法,其特征在于,在通过预测模型确定所述第一图像中的像素点对应的预测红外强度值之前,所述方法还包括:获取对所述目标场景进行拍摄得到的所述一组第三图像和所述一组第四图像;逐帧地使用所述一组第三图像中的图像作为原始模型的输入并使用所述一组第四图像中相同帧的图像作为所述原始模型的输出来对所述原始模型进行训练;当使用在可见光下拍摄得到的测试图像作为训练后的所述原始模型的输入、且所述原始模型输出的预测图像与在红外线下拍摄得到的验证图像相匹配的情况下,将训练后的所述原始模型作为所述预测模型,其中,所述测试图像和所述验证图像为所述目标场景的图像;当使用所述测试图像作为训练后的所述原始模型的输入、且所述原始模型输出的所述预测图像与所述验证图像不匹配的情况下,继续使用所述一组第三图像中的图像作为所述原始模型的输入并使用所述一组第四图像中相同帧的图像作为所述原始模型的输出来对所述原始模型进行训练,直至训练后的所述原始模型输出的所述预测图像与所述验证图像相匹配。5.根据权利要求4所述的方法,其特征在于,逐帧地使用所述一组第三图像中的图像作为原始模型的输入并使用所述一组第四图像中相同帧的图像作为所述原始模型的输出来对所述原始模型进行训练包括:将所述第三图像中的像素点的颜色值输入至所述原始模型,并将相同帧的所述第四图像中的像素点的强度值作为所述原始模型输出,其中,所述第三图像中的像素点的颜色值用于作为所述原始模型中多个预测函数的输入,所述原始模型的输出为对所述多个预测函数中每个预测函数与对应的权重之间的乘积的累积和;利用所述第三图像中的像素点的颜色值和相同帧的所述第四图像中的像素点的强度值来初始化所述预测函数对应的权重和所述预测函数内部的参数,以完成对所述原始模型的训练。6.根据权利要求1至3中任意一项所述的方法,其特征在于,确定...

【专利技术属性】
技术研发人员:陈炳文
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1