一种基于深度学习的煤矿监控视频解压缩方法及系统技术方案

技术编号:23050902 阅读:28 留言:0更新日期:2020-01-07 14:54
本发明专利技术公开一种基于深度学习的煤矿监控视频解压缩方法及系统,涉及视频压缩技术领域,采用方案包括:将原始视频差分为图像帧,并选取一帧作为背景帧;基于深度学习的注意力机制和目标检测算法将每一帧图像中的工人检测出来,并将工人所在的位置行成矩形框裁剪出来,将裁剪的工人矩形框图片、定位信息、所处理的帧信息这三项作为一组保存到链表中;从链表中依次取出工人的裁剪矩形框、位置和图像帧的编号作为一组,把每一组覆盖到背景帧中;对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调,以将重构图像帧组合形成视频。本方法只获取关键信息,减少了冗余信息,可以提高视频的压缩率。

A method and system of video decompression for coal mine monitoring based on deep learning

【技术实现步骤摘要】
一种基于深度学习的煤矿监控视频解压缩方法及系统
本专利技术涉及视频压缩
,具体的说是一种基于深度学习的煤矿监控视频解压缩方法及系统。
技术介绍
煤矿井下环境复杂,危险点较多,安全生产工作进展缓慢,为了进一步提高安全生产工作的,适应新时期国家对煤矿安全生产的客观要求,众多矿井都开始布设矿用视频监控系统。由于煤矿井下存在瓦斯、煤尘等混合气体,存在着一定的爆炸风险,故而煤矿井下视频监控系统所配备的摄像仪必须通过煤安认证和防爆认证,外壳为不锈钢构造,密封性能良好,防腐防尘防水。由于煤矿井下环境的复杂性,对视频的传输提出了更高的要求,因此需要在保证视频质量的前提下,尽量的压缩视频的大小,以提高视频实时传输的效率,保证井下工人的安全。基于深度学习的视频压缩方法对传统的H.264和H.265等传统视频压缩方法带了颠覆性的革命,使视频压缩技术得到飞速的发展,大大提高了视频的压缩效率。
技术实现思路
本专利技术针对目前技术发展的需求和不足之处,提供一种基于深度学习的煤矿监控视频解压缩方法及系统,其在保证原有视频质量的前提下能够进一步提高视频的压缩率,减少其他无关因素对视频的影响。首先,本专利技术提供一种基于深度学习的煤矿监控视频解压缩方法,解决上述技术问题采用的技术方案如下:一种基于深度学习的煤矿监控视频解压缩方法,该方法的实现过程包括:S10、将原始视频差分为图像帧,并选取一帧作为背景帧;S20、基于深度学习的注意力机制和目标检测算法将每一帧图像中的工人检测出来,并将工人所在的位置行成矩形框裁剪出来,保存为图片,随后,将裁剪的工人矩形框图片、定位信息、所处理的帧信息这三项作为一组保存到链表中,完成所有帧图像的压缩;S30、从链表中依次取出工人的裁剪矩形框、位置和图像帧的编号作为一组,把每一组覆盖到背景帧中,完成所有帧图像的解码还原;S40、对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调,以将解码还原的所有帧图像帧组合形成视频。在步骤S10中,将原始视频差分为图像帧,并选取一帧作为背景帧,其操作具体为:固定监控摄像头,使拍摄的背景保持不变;获取原始视频;将原始视频差分为图像帧;选取一张没有运动物体的图像帧作为背景图片;将背景图片存入链表的第一个位置。在步骤S20中,所述目标检测算法为基于区域的卷积神经网络,包括Fast-RCNN,SSD,YOLO,目标检测算法用于检测出物体的种类,定位物体的位置。在步骤S20中,将工人所在的位置行成矩形框裁剪出来保存为图片的过程中,将工人所在的位置作为感兴趣区域,将其他运动的物体作为非感兴趣区域对其滤除。在步骤S40中,对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调,微调的方法为:将矩形框图像的边缘和背景图像RGB颜色信息数值求均值,使两张图像之间的色彩平滑过渡,以便于将解码还原的所有帧图像帧组合形成视频。其次,本专利技术提供一种基于深度学习的煤矿监控视频解压缩系统,解决上述技术问题采用的技术方案如下:一种基于深度学习的煤矿监控视频解压缩系统,该系统包括:视频拆分模块,用于将原始视频差分为图像帧,并选取一帧作为背景帧;行人检测模块,基于深度学习的注意力机制和目标检测算法,用于将每一帧图像中的工人检测出来,并将工人所在的位置行成矩形框裁剪出来,保存为图片,随后,将裁剪的工人矩形框图片、定位信息、所处理的帧信息这三项作为一组保存到链表中,完成所有帧图像的压缩;解码还原模块,用于从链表中依次取出工人的裁剪矩形框、位置和图像帧的编号作为一组,把每一组覆盖到背景帧中,完成所有帧图像的解码还原;图像帧微调模块,用于对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调,以将解码还原的所有帧图像帧组合形成视频。具体的,所涉及视频拆分模块包括:监控摄像子模块,用于拍摄图像并保持固定;获取子模块,用于获取原始视频;拆分子模块,用于将原始视频差分为图像帧选取子模块,用于选取一张没有运动物体的图像帧作为背景图片;存储子模块,用于将背景图片存入链表的第一个位置。具体的,所涉及目标检测算法为基于区域的卷积神经网络,包括Fast-RCNN,SSD,YOLO,目标检测算法用于检测出物体的种类,定位物体的位置。具体的,所涉及行人检测模块将工人所在的位置行成矩形框裁剪出来保存为图片的过程中,会将工人所在的位置作为感兴趣区域,同时,将其他运动的物体作为非感兴趣区域对其滤除。具体的,所涉及图像帧微调模块对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调的具体方法为:将矩形框图像的边缘和背景图像RGB颜色信息数值求均值,使两张图像之间的色彩平滑过渡,以便于将解码还原的所有帧图像帧组合形成视频。本专利技术的一种基于深度学习的煤矿监控视频解压缩方法及系统,与现有技术相比具有的有益效果是:1)本专利技术基于深度学习的注意力机制和目标检测算法,根据煤矿井下工人安全状况监控的特点,通过只关注工人在煤矿井下的位置和行走轨迹,忽略其他运动的物体,对每一帧进行重构,减少了大量的冗余信息,提高了视频的压缩率,同时,还提高了煤矿的视频的传输速率,节省了大量的视频存储空间,减少了其他无关因素对视频的影响。2)本专利技术基于注意力机制保留视频所包含图片帧中的感兴趣区域,筛除非感兴趣区域,从而只需要存储少量的图片,位置信息等数据,大大缩小了存储空间,以提高视频在传输过程中的效率。附图说明附图1是本专利技术实施例一的方法流程图;附图2是本专利技术实施例二的连接框图。附图中各标号信息表示:1、视频拆分模块,2、行人检测模块,3、解码还原模块,4、图像帧微调模块;5、监控摄像子模块,6、获取子模块,7、拆分子模块,8、选取子模块,9、存储子模块。具体实施方式为使本专利技术的技术方案、解决的技术问题和技术效果更加清楚明白,以下结合具体实施例,对本专利技术的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是全部的实施例。实施例一:结合附图1,本实施例提出一种基于深度学习的煤矿监控视频解压缩方法,该方法的实现过程包括:S10、将原始视频差分为图像帧,并选取一帧作为背景帧;S20、基于深度学习的注意力机制和目标检测算法将每一帧图像中的工人检测出来,并将工人所在的位置行成矩形框裁剪出来,保存为图片,随后,将裁剪的工人矩形框图片、定位信息、所处理的帧信息这三项作为一组保存到链表中,完成所有帧图像的压缩;S30、从链表中依次取出工人的裁剪矩形框、位置和图像帧的编号作为一组,把每一组覆盖到背景帧中,完成所有帧图像的解码还原;S40、对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行本文档来自技高网...

【技术保护点】
1.一种基于深度学习的煤矿监控视频解压缩方法,其特征在于,该方法的实现过程包括:/nS10、将原始视频差分为图像帧,并选取一帧作为背景帧;/nS20、基于深度学习的注意力机制和目标检测算法将每一帧图像中的工人检测出来,并将工人所在的位置行成矩形框裁剪出来,保存为图片,随后,将裁剪的工人矩形框图片、定位信息、所处理的帧信息这三项作为一组保存到链表中,完成所有帧图像的压缩;/nS30、从链表中依次取出工人的裁剪矩形框、位置和图像帧的编号作为一组,把每一组覆盖到背景帧中,完成所有帧图像的解码还原;/nS40、对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调,以将解码还原的所有帧图像帧组合形成视频。/n

【技术特征摘要】
1.一种基于深度学习的煤矿监控视频解压缩方法,其特征在于,该方法的实现过程包括:
S10、将原始视频差分为图像帧,并选取一帧作为背景帧;
S20、基于深度学习的注意力机制和目标检测算法将每一帧图像中的工人检测出来,并将工人所在的位置行成矩形框裁剪出来,保存为图片,随后,将裁剪的工人矩形框图片、定位信息、所处理的帧信息这三项作为一组保存到链表中,完成所有帧图像的压缩;
S30、从链表中依次取出工人的裁剪矩形框、位置和图像帧的编号作为一组,把每一组覆盖到背景帧中,完成所有帧图像的解码还原;
S40、对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调,以将解码还原的所有帧图像帧组合形成视频。


2.根据权利要求1所述的一种基于深度学习的煤矿监控视频解压缩方法,其特征在于,在步骤S10中,将原始视频差分为图像帧,并选取一帧作为背景帧,其操作具体为:
固定监控摄像头,使拍摄的背景保持不变;
获取原始视频;
将原始视频差分为图像帧;
选取一张没有运动物体的图像帧作为背景图片;
将背景图片存入链表的第一个位置。


3.根据权利要求1所述的一种基于深度学习的煤矿监控视频解压缩方法,其特征在于,在步骤S20中,所述目标检测算法为基于区域的卷积神经网络,包括Fast-RCNN,SSD,YOLO,目标检测算法用于检测出物体的种类,定位物体的位置。


4.根据权利要求3所述的一种基于深度学习的煤矿监控视频解压缩方法,其特征在于,在步骤S20中,将工人所在的位置行成矩形框裁剪出来保存为图片的过程中,将工人所在的位置作为感兴趣区域,将其他运动的物体作为非感兴趣区域对其滤除。


5.根据权利要求1所述的一种基于深度学习的煤矿监控视频解压缩方法,其特征在于,在步骤S40中,对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调,微调的方法为:
将矩形框图像的边缘和背景图像RGB颜色信息数值求均值,使两张图像之间的色彩平滑过渡,以便于将解码还原的所有帧图像帧组合形成视频。


6.一...

【专利技术属性】
技术研发人员:尹青山李锐于治楼
申请(专利权)人:山东浪潮人工智能研究院有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1