The invention discloses a video image encoding and decoding method for mine intelligent monitoring. The method adopts convolutional neural network algorithm based on machine vision to realize the encoding and decoding functions of mine video images. It includes the following steps: (1) collecting images by using mine video image acquisition equipment, and making training sets and test sets accordingly; (2) constructing the encoder of mine video images. Network and decoder network: Encoder network includes down-sampling layer, decoder network includes up-sampling layer, two-branch convolution layer, standardization layer, non-linear activation layer and depth conversion layer; (3) training network; (4) using trained network to complete mine video coding and decoding. This method solves the problem of long time of encoding and decoding and signal reconstruction of mine video surveillance system, and improves the performance of mine intelligent video surveillance system.
【技术实现步骤摘要】
一种用于矿井智能监控的视频图像编解码方法
本专利技术属于智能监控与图像处理领域的信号编码、解码技术,具体涉及一种用于矿井智能监控的视频图像编解码方法。
技术介绍
实现井下工作面的少人乃至无人作业是安全开采和智慧矿山建设最重要的目标之一,研究矿井智能视频监视系统优化方法及其关键技术,对促进矿井智能安全开采技术发展及智慧矿山建设具有十分重要的意义。传统的视频监视系统中图像压缩方法采用经典的奈奎斯特采样定理来解决视频图像的信号采集、编码和解码问题。然而,矿井视频图像信号的数据量大,采用传统的压缩方法不仅浪费了大量的采样资源,而且给图像的压缩、存储和传输带来了巨大的困难。在井下通信环境带宽资源有限条件下,使用以奈奎斯特定理为基础的图像处理与压缩方法使得系统开销较大,采用常规的图像编解码方法难以解决视频图像压缩处理时出现的图像模糊、视频传输延迟等问题,直接影响矿井视频图像信号的实时传输和智能监控性能。近年来提出的压缩感知理论认为,对稀疏信号或者在某个字典基中有稀疏表达的信号而言,采样个数完全可以取少于奈奎斯特采样定理要求的数量,而重构信号仍能保持无失真或仅有较少失真,该理论突破了传统奈奎斯特采样定理的瓶颈,为采集高分辨率信号提供了理论基础。另一方面,多数图像信号完全可以在傅里叶变换基下得到其稀疏表达,这为矿井视频图像信号的编解码提供了新的手段。在压缩感知的框架下,已知信号的测量值y=Φx,压缩感知的核心问题是基于观测值y如何重构出原始的信号x。既有的解决方法或把稀疏信号的重构看成是凸优化问题,或是通过稀疏逼近间接解决稀疏信号的重构问题。虽然这些方法对视频图像具有较好 ...
【技术保护点】
1.一种用于矿井智能监控的视频图像编解码方法,其特征在于,采用基于机器视觉的卷积神经网络算法,实现对矿井视频图像的编码和解码功能,包括如下步骤:步骤1,制作训练集和测试集:利用矿井视频图像采集设备采集图像,据此制作训练集和测试集;步骤2,构建矿井视频图像的编码器网络和解码器网络:编码器网络包括降采样层,解码器网络包括升采样层、二分支卷积层、标准化层、非线性激活层和深度变换层;步骤3,网络训练:将训练集输入所述编码器网络,将所述编码器网络的输出作为所述解码器网络的输入,完成网络参数的训练;步骤4,矿井视频图像的编码和解码:利用步骤3中训练好的网络,将步骤1中所述测试集中矿井视频图像输入步骤3中所述编码器网络,矿井视频图像经编码后传输至步骤3中所述解码器网络进行解码,输出矿井视频图像的重构结果;其特征还在于,步骤2中所述的编码器网络通过以下公式对信号进行降采样:y=Φx其中,
【技术特征摘要】
1.一种用于矿井智能监控的视频图像编解码方法,其特征在于,采用基于机器视觉的卷积神经网络算法,实现对矿井视频图像的编码和解码功能,包括如下步骤:步骤1,制作训练集和测试集:利用矿井视频图像采集设备采集图像,据此制作训练集和测试集;步骤2,构建矿井视频图像的编码器网络和解码器网络:编码器网络包括降采样层,解码器网络包括升采样层、二分支卷积层、标准化层、非线性激活层和深度变换层;步骤3,网络训练:将训练集输入所述编码器网络,将所述编码器网络的输出作为所述解码器网络的输入,完成网络参数的训练;步骤4,矿井视频图像的编码和解码:利用步骤3中训练好的网络,将步骤1中所述测试集中矿井视频图像输入步骤3中所述编码器网络,矿井视频图像经编码后传输至步骤3中所述解码器网络进行解码,输出矿井视频图像的重构结果;其特征还在于,步骤2中所述的编码器网络通过以下公式对信号进行降采样:y=Φx其中,为待编码的图像,为测量矩阵,是所述编码器网络的待学习参数,M<N,为编码结果;进一步地,步骤2中所述的解码器网络采用多个升采样层-二分支卷积层级联结构,并与深度变换层连接而成,其中,所述二分支卷积层由两个分支分别连接到加法器,所述两个分支的第一分支由两个或两个以上的分支单元级联后连接至所述加法器,所述两个分支的第二分支直接连接至所述加法器,或通过单个分支单元后连接至所述加法器,所述分支单元由3×3卷积层、标准化层和非线性激活层顺次连接构成;步骤2中所述的升采样层采用双线性插值法对图像进行升采样,得到第k个升采样层输出的图像的像素个数为Pk:其中,n表示整个解码器网络中升采样层的数量,k=1,2,…,n,M表示解码器网络输入图像的像素个数,N表示来自数据集的原始输入图像的像素个数,符号表示向上取整;步骤2中所述的标准化层采用批标准化对输入的图像进行标准化;步骤2中所述的非线性激活层采用...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。