一种基于机器学习的视频处理方法技术

技术编号:23893559 阅读:36 留言:0更新日期:2020-04-22 07:29
本发明专利技术公开了一种基于机器学习的视频处理方法。它包括筛选数据和提取特征形成数据集、训练生成预测模型、视频处理三个部分,具体包括如下步骤:(1)构建数据集时,首先通过一定规则对视频序列筛选样本点,尽可能去除视频内容空间冗余和时间冗余,最终每帧图像都提取一定比例的像素点作为样本形成数据集;(2)训练生成预测模型时,采用简单的多层全连接神经网络,保证预测精度的同时运算复杂度较低;(3)视频处理时,使用训练好的预测模型对输入图像进行处理,然后再进行去块效应滤波和样点自适应补偿滤波。本发明专利技术的有益效果是:简化处理流程,运算复杂度低;适应大多数不同风格的视频,呈现很好的图像美感和保真度。

【技术实现步骤摘要】
一种基于机器学习的视频处理方法
本专利技术涉及视频图像处理相关
,尤其是指一种基于机器学习的视频处理方法。
技术介绍
高动态范围(HighDynamicRange,以下简称HDR)视频,相对于标准动态范围(StandardDynamicRange,以下简称SDR)视频,图像的明暗层次更清晰,图像细节更丰富,能够更逼真的重现真实场景。随着HDR技术的发展以及HDR显示器的逐步普及,对HDR视频的需求逐步增加。真正的HDR视频制作需要在采集端使用高动态范围的成像器件,制作时也要使用支持HDR非编软件,也就是说HDR视频的内容制作对拍摄设备和前处理技术都有很高的要求,因此目前市场上的HDR内容仍处于相对匮乏的状态。另一方面,市场上有比较充足的制作精良的高清/超高清SDR片源。如何将这些SDR内容转换成高质量HDR格式视频,具有比较重要的现实意义。目前大部分的研究集中在SDR图像和HDR图像的相互转换,色调映射(ToneMapping)和逆色调映射(InverseToneMapping)是SDR图像和HDR图像之间相互转换的关键技术。SD本文档来自技高网...

【技术保护点】
1.一种基于机器学习的视频处理方法,其特征是,包括筛选数据和提取特征形成数据集、训练生成预测模型、视频处理三个部分,具体包括如下步骤:/n(1)构建数据集时,首先通过一定规则对视频序列筛选样本点,尽可能去除视频内容空间冗余和时间冗余,使得得到的数据集在规模不大的情况下覆盖尽可能多的数据特征,既考虑场景内整体的亮度和对比度,又考虑每个图像帧和16x16宏块的亮度和对比度,最终每帧图像都提取一定比例的像素点作为样本形成数据集;/n(2)训练生成预测模型时,采用简单的多层全连接神经网络,保证预测精度的同时运算复杂度较低;/n(3)视频处理时,使用训练好的预测模型对输入图像进行处理,然后再进行去块效应...

【技术特征摘要】
1.一种基于机器学习的视频处理方法,其特征是,包括筛选数据和提取特征形成数据集、训练生成预测模型、视频处理三个部分,具体包括如下步骤:
(1)构建数据集时,首先通过一定规则对视频序列筛选样本点,尽可能去除视频内容空间冗余和时间冗余,使得得到的数据集在规模不大的情况下覆盖尽可能多的数据特征,既考虑场景内整体的亮度和对比度,又考虑每个图像帧和16x16宏块的亮度和对比度,最终每帧图像都提取一定比例的像素点作为样本形成数据集;
(2)训练生成预测模型时,采用简单的多层全连接神经网络,保证预测精度的同时运算复杂度较低;
(3)视频处理时,使用训练好的预测模型对输入图像进行处理,然后再进行去块效应滤波和样点自适应补偿滤波。


2.根据权利要求1所述的一种基于机器学习的视频处理方法,其特征是,在步骤(1)中,构建数据集的具体操作方法如下:
(11)使用HDR摄像机,拍摄生成多段同样内容的HDR和SDR素材;
(12)对于SDR素材,进行场景检测,并以16x16的宏块MB分割图像,并将相邻的4x4个宏块MB作为搜索单元;
(13)如果当前帧为序列开始帧或场景切换点,那么选取每个搜索单元的左上角宏块为有效宏块,并记录该宏块坐标(x,y);如果当前帧为场景内的某一帧,那么以前一帧的有效宏块坐标(x’,y’)作为基准宏块,在搜索单元内依次遍历所有宏块并计算与基准宏块的亮度值的欧氏距离,并以欧式距离最大的宏块作为有效宏块,并记录该宏块坐标(x,y);
(14)以步长4对有效宏块内的像素点进行降采样,即每个宏块提取到4x4=16个有效像素点;
(15)以每个有效像素点的Y/U/V分量分别作为每一个样本点的3个特征值;
(16)对有效宏块的256个像素进行直方图统计,分别获取Y/U/V分量的数值的平均值、中位值,并获取其最大值和最小值,这样Y/U/V三个分量的最大值、最小值、平均值、中位值,共12个数值作为整个宏块中每个样本点的特征值;
(17)对整帧图像的像素点做直方图统计,分别获取Y/U/V分量的数值的平均值、中位值、众数值,并获取其最大值和最小值,这样Y/U/V三个分量的最大值、最小值、平均值、中位值、众数值,共15个数值作为整帧图像中每个样本点的特征值;
(18)如果检测到场景切换,那么统计前一个场景的亮度平均值,作为整个场景中每个样本点的特...

【专利技术属性】
技术研发人员:王建伟谢亚光陈勇孙彦龙
申请(专利权)人:杭州当虹科技股份有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1