基于卷积神经网络的块内容分类方法技术

技术编号：17214628 阅读：33 留言：0更新日期：2018-02-08 01:00

本发明专利技术公开了一种基于卷积神经网络的块内容分类方法，包括：构建数据集，将其内容类型作为训练样本的标签；构建卷积神经网络，将训练样本转换为灰度图，再将灰度图的每个像素用八比特二进制数进行表示，提取每个像素的末位比特来做为卷积神经网络的输入，通过训练获得末位比特‑卷积神经网络模型；对输入的N×N的编码块进行预测时，利用末位比特‑卷积神经网络模型预测当前编码块的内容类型，若输出为相机拍摄块，则获得分类结果；若输出为计算机生成块，则利用末位比特‑卷积神经网络模型进行预测，获得相应的计算机生成文本块或计算机生成非文本块的分类结果。该方法可提高内容类型预测的准确度与计算效率，进而减少冗余计算，提高压缩质量。

Block content classification method based on convolution neural network

The invention discloses a method, block classification based on convolutional neural network include: constructing the data set, the content type as the training sample label; construct the convolutional neural network, the training sample will be converted to grayscale, and then each pixel grayscale binary number with eight bits, each bit from bottom pixel for convolutional neural network input, obtain the last bit convolutional neural network model through training; prediction encoding block on the input of the N * N, measuring the content type of the current block using the last bit encoding model convolutional neural network pre, if the output for the camera, then get the classification results; if the output is generated by the computer, bit convolution neural network prediction model, obtain the corresponding computer generated text blocks or computer Classification results of non text blocks. This method can improve the accuracy and efficiency of the content type prediction, and then reduce the redundancy calculation and improve the compression quality.

全部详细技术资料下载

【技术实现步骤摘要】
基于卷积神经网络的块内容分类方法
本专利技术涉及视频编码
，尤其涉及一种基于卷积神经网络的块内容分类方法。
技术介绍
卷积神经网络作为深度学习算法中的一种，目前已经被广泛应用于图像分类和模式识别领域中。与此同时，高效视频编码(HEVC)扩展延伸的屏幕内容编码(SCC)采用了调色板模式(Palette)，帧内块预测模式(IBC)来提高编码效率，这样也不可避免地带来了很高的编码复杂度。预测每个编码单元的内容类型是关键的一步，虽然目前已有一些工作通过低层特征，比如梯度、方差、熵和颜色数量等，可以被用于编码块的分类。然而，相关方法对于编码块内容类型预测的准确度还有待提高。
技术实现思路
本专利技术的目的是提供一种基于卷积神经网络的块内容分类方法，可以提高内容类型预测的准确度与计算效率。本专利技术的目的是通过以下技术方案实现的：一种基于卷积神经网络的块内容分类方法，包括：构建数据集，并将其内容类型作为训练样本的标签；构建卷积神经网络，将训练样本转换为灰度图，再将灰度图的每个像素用八比特二进制数进行表示，提取每个像素的末位比特来做为卷积神经网络的输入，通过训练获得末位比特-卷积神经网络模型；对输入的N×N的编码块进行预测时，首先利用末位比特-卷积神经网络模型预测当前编码块的内容类型，若输出为相机拍摄块，则获得分类结果；若输出为计算机生成块，则继续利用末位比特-卷积神经网络模型进行预测，获得相应的计算机生成文本块或计算机生成非文本块的分类结果。由上述本专利技术提供的技术方案可以看出，根据预先训练的卷积神经网络模型，对每个编码单元预测其内容类型，预测结果具有较高的准确度...
基于卷积神经网络的块内容分类方法

【技术保护点】
一种基于卷积神经网络的块内容分类方法，其特征在于，包括：构建数据集，并将其内容类型作为训练样本的标签；构建卷积神经网络，将训练样本转换为灰度图，再将灰度图的每个像素用八比特二进制数进行表示，提取每个像素的末位比特来做为卷积神经网络的输入，通过训练获得末位比特‑卷积神经网络模型；对输入的N×N的编码块进行预测时，首先利用末位比特‑卷积神经网络模型预测当前编码块的内容类型，若输出为相机拍摄块，则获得分类结果；若输出为计算机生成块，则继续利用末位比特‑卷积神经网络模型进行预测，获得相应的计算机生成文本块或计算机生成非文本块的分类结果。

【技术特征摘要】
1.一种基于卷积神经网络的块内容分类方法，其特征在于，包括：构建数据集，并将其内容类型作为训练样本的标签；构建卷积神经网络，将训练样本转换为灰度图，再将灰度图的每个像素用八比特二进制数进行表示，提取每个像素的末位比特来做为卷积神经网络的输入，通过训练获得末位比特-卷积神经网络模型；对输入的N×N的编码块进行预测时，首先利用末位比特-卷积神经网络模型预测当前编码块的内容类型，若输出为相机拍摄块，则获得分类结果；若输出为计算机生成块，则继续利用末位比特-卷积神经网络模型进行预测，获得相应的计算机生成文本块或计算机生成非文本块的分类结果。2.根据权利要求1所述的一种基于卷积神经网络的块内容分类方法，其特征在于，利用末位比特-卷积神经网络模型预测当前编码块的内容类型包括：将当前编码块转换为灰度图，再将灰度图的每个像素用八比特二进制数进行表示，提取每个像素的末位比特，获得相应的末尾比特图，再利用末位比特-卷积神经网络模型对末尾比特图的内容类型进行预测；若输出为相机拍摄块，则获得分类结果，终止流程；若输出为计算机生成块，则根据计算机生成块的位置信息从灰度图中提取对应的灰度块，再利用末位比特-卷积神经网络模型对灰度块的内容类型进行预测；输出的分类结果为计算机生成文本块或计算机生成非文本块。3.根据权利要求1所述的一种基于卷积神经网络的块内容分类方法，其特征在于，对于输入的非N×N的编码块；若尺寸大于N×N，则根据其内部包含的所有N×N的编码块的内容类型来...

【专利技术属性】
技术研发人员：陈志波，叶淑睿，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：安徽,34

全部详细技术资料下载我是这个专利的主人