一种基于活动轮廓的视频编码方法、系统、装置及介质制造方法及图纸

技术编号:30074818 阅读:10 留言:0更新日期:2021-09-18 08:29
本发明专利技术公开了一种基于活动轮廓的视频编码方法、系统、装置及介质,其中方法包括以下步骤:获取原始视频,将所述原始视频分割为多个视频段落,将视频段落中的视频分成多帧视频图像;对所述视频图像进行显著性区域预测,获得视频图像的显著图;根据显著图和活动轮廓对视频图像进行分割;利用图像分割结果和基于显著性的编码分块策略,进行视频编码。本发明专利技术通过运用显著性检测技术获得用户关注的区域,结合活动轮廓模型技术对视频序列进行分割,既保存了复杂场景中的视频细节,同时也有效提高了视频编码效率,可广泛应用于图像分割技术领域。可广泛应用于图像分割技术领域。可广泛应用于图像分割技术领域。

【技术实现步骤摘要】
一种基于活动轮廓的视频编码方法、系统、装置及介质


[0001]本专利技术涉及图像分割
,尤其涉及一种基于活动轮廓的视频编码方法、系统、装置及介质。

技术介绍

[0002]随着数字新媒体和互联网技术的发展,用户对高清视频的需求量逐渐增加,同时对视频图像分辨率的要求越来越高。目前人们常用的视频图像分辨率为1080P高清,正逐渐向4K和8K超清方向发展。然而,人们通过各种方式看到的各类视频,均为经过压缩后的视频。因为如果这些高分辨率的视频未经压缩,则这些视频将会具有相当大的数据量。目前的数据传输速度无法承载如此大的数据量,难以用于实际的应用与存储。对于高分辨率且具有复杂场景的视频,如何能够在有限的网络带宽和存储空间下,既能够保留其视频细节的同时,又能提高编码效率则显得尤为重要。
[0003]相对于传统的视频编码来说,新一代基于内容的多媒体数据压缩编码国际标准MPEG

4第一次提出了基于对象的视频编码新概念。MPEG

4实现基于内容的交互的首要任务就是将视频图像分割成不同对象或者把运动对象从背景中分离出来,然后针对不同对象采用相应编码方法,以实现高效压缩。根据大量人类视觉生理学和视觉心理学实验表明,针对一幅视频图像,人眼往往会对内容做出相对应的选择性和迁移性,即人眼会下意识地将一幅图像划分为若干个不同的区域,注意力也会最先集中在最感兴趣的区域。若让观察者感兴趣的区域,如图像中高速运动、色彩鲜艳等图像区域失真则会引起观察者的强烈反馈。因此在面对复杂场景视频内容时,根据人眼感兴趣的相关特征,预测用户关注的区域并对其予以不同程度的编码资源倾斜,有助于提高编码压缩效率。
[0004]现有的基于显著性检测的视频编码方法中,大多数采用目标检测、语义分割等基于深度学习的分割方法,而这些方法基于卷积神经网络(CNN)来实现对目标进行分割。但基于CNN的分割方法存在的问题是很容易模糊或丢失图像的边界,特别是同时进行用于捕获高级语义和丰富的空间特征。现有的常用于显著性检测的方法为Salient Object Detection Networks(显著目标检测网络),此方法为基于在海量数据集上预训练的卷积神经网络(Convolutional Neural Networks,CNNs)。在对于边缘信息的处理上,相比于传统的图像活动轮廓分割方法,该方法基于深度学习的显著性检测方法仍有一定提升空间。同时该模型需要海量的数据集进行预训练,对设备的要求较高和计算量较大。

技术实现思路

[0005]为至少一定程度上解决现有技术中存在的技术问题之一,本专利技术的目的在于提供一种基于活动轮廓的视频编码方法、系统、装置及介质。
[0006]本专利技术所采用的技术方案是:
[0007]一种基于活动轮廓的视频编码方法,包括以下步骤:
[0008]获取原始视频,将所述原始视频分割为多个视频段落,将视频段落中的视频分成
多帧视频图像;
[0009]对所述视频图像进行显著性区域预测,获得视频图像的显著图;
[0010]根据显著图和活动轮廓对视频图像进行分割;
[0011]利用图像分割结果和基于显著性的编码分块策略,进行视频编码。
[0012]进一步,所述对所述视频图像进行显著性区域预测,获得视频图像的显著图,包括:
[0013]采用SLIC算法生成超像素,根据超像素对视频图像进行分割;
[0014]提取分割后图像的色彩特征和纹理特征;
[0015]根据色彩距离和纹理距离对色彩特征和纹理特征进行计算融合,获得视频图像的显著图。
[0016]进一步,所述色彩特征通过以下方式提取:
[0017]统计每个超像素区域的CIELAB色彩直方图,获得色彩特征C
k
=(L
k
,A
k
,B
k
);
[0018]其中,利用高斯分布来拟合色彩直方图,获得每个超像素区域的色彩特征为其中,利用高斯分布来拟合色彩直方图,获得每个超像素区域的色彩特征为
[0019]μ与σ2为高斯分布的均值和方差;
[0020]所述纹理特征在四个方向上由四个统计量来描述:T
k
=(ASM
k
,CON
k
,COR
k
,L
k
);
[0021]其中,四个统计量分别为能量、对比度、相关度和同质性;四个方向为μ
x
,μ
y
,σ
x
,σ
y

[0022]进一步,所述色彩距离为衡量概率分布之间的差距,所述色彩距离的表达式为:
[0023][0024]其中,为第i个超像素的全局色彩特征,m为超像素区域总个数,为第i个超像素区域与第j个超像素区域的局部特征距离,j为第j个超像素区域;
[0025]所述纹理距离采用欧氏距离衡量,所述纹理距离的表达式为:
[0026][0027]其中,T
k
为归一化的纹理特征份量值,k为矩阵维数,m为超像素总个数,j为第j个超像素;
[0028]第i个超像素的显著度表示为:
[0029][0030]其中,λ为归一化因子。
[0031]进一步,所述根据显著图和活动轮廓对视频图像进行分割,包括:
[0032]获取归一化的显著图I
Q

[0033]根据显著图I
Q
获得显著图的边缘映射f
Q
,根据边缘映射f
Q
计算显著图的向量场(U
Q
,V
Q
);
[0034]根据向量场(U
Q
,V
Q
)对视频图像的初始轮廓进行一次演化;
[0035]获取视频图像的梯度向量场(U
GVF
,V
GVF
),将梯度向量场(U
GVF
,V
GVF
)和向量场(U
Q
,V
Q
)
进行混合,获得混合向量场(U,V);
[0036]根据混合向量场(U,V)对经过一次演化的轮廓线进行二次演化,实现对视频图像的分割。进一步,所述混合向量场(U,V)的表达式为:
[0037](U,V)=α(U
GVF
,V
GVF
)+β(U
Q
,V
Q
)
[0038]其中,α,β是满足α+β=1非负参数。
[0039]进一步,所述利用图像分割结果和基于显著性的编码分块策略,进行视频编码,包括:
[0040]将一帧图像划分为若干个互不重叠的树形编码宏块;
[0041]若树形编码宏块中存有分割的图像,将所述树形编码宏块标记为显著性较强的区域,对所述树形编码宏块分割成为多个第一子块,根据第一子块进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于活动轮廓的视频编码方法,其特征在于,包括以下步骤:获取原始视频,将所述原始视频分割为多个视频段落,将视频段落中的视频分成多帧视频图像;对所述视频图像进行显著性区域预测,获得视频图像的显著图;根据显著图和活动轮廓对视频图像进行分割;利用图像分割结果和基于显著性的编码分块策略,进行视频编码。2.根据权利要求1所述的一种基于活动轮廓的视频编码方法,其特征在于,所述对所述视频图像进行显著性区域预测,获得视频图像的显著图,包括:采用SLIC算法生成超像素,根据超像素对视频图像进行分割;提取分割后图像的色彩特征和纹理特征;根据色彩距离和纹理距离对色彩特征和纹理特征进行计算融合,获得视频图像的显著图。3.根据权利要求2所述的一种基于活动轮廓的视频编码方法,其特征在于,所述色彩特征通过以下方式提取:统计每个超像素区域的CIELAB色彩直方图,获得色彩特征C
k
=(L
k
,A
k
,B
k
);其中,利用高斯分布来拟合色彩直方图,获得每个超像素区域的色彩特征为其中,利用高斯分布来拟合色彩直方图,获得每个超像素区域的色彩特征为μ与σ2为高斯分布的均值和方差;所述纹理特征在四个方向上由四个统计量来描述:T
k
=(ASM
k
,CON
k
,COR
k
,L
k
);其中,四个统计量分别为能量、对比度、相关度和同质性;四个方向为μ
x
,μ
y
,σ
x
,σ
y
。4.根据权利要求2所述的一种基于活动轮廓的视频编码方法,其特征在于,所述色彩距离为衡量概率分布之间的差距,所述色彩距离的表达式为:其中,为第i个超像素的全局色彩特征,m为超像素区域总个数,为第i个超像素区域与第j个超像素区域的局部特征距离,j为第j个超像素区域;所述纹理距离采用欧氏距离衡量,所述纹理距离的表达式为:其中,T
k
为归一化的纹理特征份量值,k为矩阵维数,m为超像素总个数,j为第j个超像素;第i个超像素的显著度表示为:其中,λ为归一化因子。5.根据权利要求1所述的一种基于活动轮廓的视频编码方法,其特征在于,所述根据显著图和活动轮廓对视频图像进行分割,包括:获取归一化的显著图I
Q

根据显著图I
Q
获得显著图的边缘映射f
Q

【专利技术属性】
技术研发人员:梁燕慧周智恒
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1