当前位置: 首页 > 专利查询>华侨大学专利>正文

基于人眼恰可察觉失真的屏幕内容视频编码感知码率控制方法及装置制造方法及图纸

技术编号:36207940 阅读:35 留言:0更新日期:2023-01-04 12:03
本发明专利技术公开了一种基于人眼恰可察觉失真的屏幕内容视频编码感知码率控制方法及装置,属于视频编码领域。首先获取屏幕内容视频,对屏幕内容视频进行边缘建模,得到二维边缘模型,提取二维边缘模型的边缘特征,并计算得到二维边缘模型的边缘模型参数;基于边缘模型参数获取亮度自适应阈值、对比度掩蔽效应阈值、边缘非结构失真敏感度阈值以及结构失真敏感度阈值,构建屏幕内容视频的像素域JND模型,确定JND因子;然后利用边缘特征和JND因子指导感知复杂度分类和目标比特分配;最后通过参考视频帧和重建视频帧的边缘相似度构建在JND约束条件下的感知码率控制模型。该方法能够提高屏幕内容视频的码率控制精度,明显改善屏幕内容视频的编码率失真性能。视频的编码率失真性能。视频的编码率失真性能。

【技术实现步骤摘要】
基于人眼恰可察觉失真的屏幕内容视频编码感知码率控制方法及装置


[0001]本专利技术涉及视频编码领域,具体涉及一种基于人眼恰可察觉失真的屏幕内容视频编码感知码率控制方法及装置。

技术介绍

[0002]随着互联网技术越来越成熟,视频应用变得越来越丰富,视频通信的需求日渐上涨。而原始视频信号的数据量十分庞大,对于传输和存储都是巨大的负担,因此对视频进行压缩编码十分必要。为了不同公司不同产品的互联互通,国际视频组织制定了一系列视频编码标准来统一视频压缩后的码流格式。其中,H.264/AVC是当前应用最广泛的视频编码标准,它使得高清视频和互联网视频广泛传播。随着人们对视频清晰度和压缩效率的要求提高,高效视频编码HEVC/H.265被提出,相比H.264/AVC,在同等视频编码质量下可以节省一半的码率,促进了高动态视频和超高清视频的应用。
[0003]近年来,屏幕内容视频应用逐渐深入人们的日常生活中,如视频会议、在线教育、游戏直播等,人们对屏幕内容视频的需求越来越大。屏幕内容视频是计算机生成的,与摄像机采集到的自然视频有很多不同的特点。一方面,在本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于人眼恰可察觉失真的屏幕内容视频编码感知码率控制方法,其特征在于,包括以下步骤:S1,获取屏幕内容视频,对所述屏幕内容视频进行边缘建模,得到二维边缘模型,提取所述二维边缘模型的边缘特征,并计算得到所述二维边缘模型的边缘模型参数;S2,基于所述边缘模型参数获取亮度自适应阈值、对比度掩蔽效应阈值、边缘非结构失真敏感度阈值以及结构失真敏感度阈值,根据所述亮度自适应阈值、对比度掩蔽效应阈值、边缘非结构失真敏感度阈值以及结构失真敏感度阈值构建屏幕内容视频的像素域JND模型,确定JND因子;S3,根据所述边缘特征得到边缘特征因子,利用所述边缘特征因子和所述JND因子引导目标比特分配;S4,在像素域JND模型的约束下,根据参考帧的边缘特征因子与重建帧的边缘特征因子计算得到参考帧与重建帧的相似度测量因子,基于所述参考帧与重建帧的相似度测量因子构建感知率失真模型;S5,通过感知率失真模型进行编码参数估计,根据实际编码参数更新所述感知率失真模型。2.根据权利要求1所述的基于人眼恰可察觉失真的屏幕内容视频编码感知码率控制方法,其特征在于,所述步骤S1具体包括:将一维边缘模型拓展为二维边缘模型,拓展后的二维边缘模型计算如下:其中,边缘模型参数b、c和w分别表示边缘轮廓的亮度、对比度和结构,x表示二维边缘模型水平方向坐标,y表示二维边缘模型垂直方向坐标,θ表示二维边缘模型的方向角度,erf(
·
)为误差函数;对所述屏幕内容视频的二维边缘模型进行二维高斯偏导滤波,得到二维边缘检测算子e
2D
(x,y;c,w,σ,θ),计算如下:e
2D
(x,y;c,w,σ,θ)=|e
x
(x,y;c,w,σ,θ)|+|e
y
(x,y;c,w,σ,θ)|;其中,σ表示高斯函数的平滑参数;将所述二维边缘检测算子e
2D
(x,y;c,w,σ,θ)与屏幕内容视频进行卷积,提取到其边缘特征;所述边缘模型参数的计算如下:所述边缘模型参数的计算如下:所述边缘模型参数的计算如下:其中e1、e2、e3分别是一维边缘x=(0,a,

a)三个位置经过高斯偏导滤波后的响应,
3.根据权利要求2所述的基于人眼恰可察觉失真的屏幕内容视频编码感知码率控制方法,其特征在于,所述屏幕内容视频经过边缘检测后,分为边缘像素集S
E
和非边缘像素集,所述步骤S2中,基于所述边缘像素集S
E
获取亮度自适应阈值、对比度掩蔽效应阈值、边缘非结构失真敏感度阈值以及结构失真敏感度阈值。4.根据权利要求3所述的基于人眼恰可察觉失真的屏幕内容视频编码感知码率控制方法,其特征在于,所述步骤S2具体包括:所述边缘像素集S
E
中边缘像素p的亮度自适应阈值计算如下:T
elum
(p)=s
2D
(p;T
lum
(p)+b,c,w)

s(p;b,c,w);其中,T
lum
(p)表示亮度掩蔽效应,当边缘像素p属于边缘像素集S
E
时,沿边缘轮廓的平均亮度为I(p)=b+c/2,参数α1、α2、β为常数;所述边缘像素p的对比度掩蔽效应阈值计算如下:所述边缘像素p的对比度掩蔽效应阈值计算如下:所述边缘像素p的对比度掩蔽效应阈值计算如下:其中,c(p)表示边缘像素p的对比度,f
th
为常数;通过亮度自适应阈值T
elum
(p)和对比度掩蔽效应阈值T
econ
(p)的非线性可加性模型融合得到边缘非结构失真敏感度阈值T
nstr
(p),计算公式如下:T
nstr
(p)=T
elum
(p)+T
econ
(p)

C
nstr
·
min{T
elum
(p),T
econ
(p)};其中,0<C
nstr
<1;边缘像素p的结构失真敏感度阈值计算如下:T
str
(p)=|s
2D
(p;b,c,w+Δw)

s
2D
(p;b,c,w)|;融合所述边缘非结构失真敏感度以及结构失真敏感度阈值,获得适应于屏幕内容视频的边缘像素人眼恰可察觉失真阈值T
e
(p),即边缘像素p的JND因子,具体计算如下:T
e
(p)=T
nstr
(p)+T
str
(p)

C
e
·
min{T
str
(p),T
nstr
(p)};其中,C
e
为常数,对非边缘像素集,只考虑亮度掩蔽效应可见性阈值,整合后得到最终屏幕内容视频的像素域JND模型如下:
5.根据权利要求4所述的基于人眼恰可察觉失真的屏幕内容视频编码感知码率控制方法,其特征在于,所述步骤S3具体包括:在帧级,根据当前编码帧在当前GOP中的感知权重大小给当前编码帧分配目标比特,所述当前编码帧在当前GOP中的感知权重PW
cur
计算如下:其中,EF
GOP
表示当前整个GOP的边缘特征因子,EF
coded
表...

【专利技术属性】
技术研发人员:陈婧王世萍陈淋淋曾焕强朱建清蔡灿辉
申请(专利权)人:华侨大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1