用于美颜的视频编码算法制造技术

技术编号:21612954 阅读:68 留言:0更新日期:2019-07-13 20:57
本发明专利技术公开了一种用于美颜的视频编码算法、装置、设备和存储介质,首先找到人脸和五官的位置,然后对五官进行美化,继而采用JND的DCT域方法,得到每一帧的DCT的JND域值,将每一帧的DCT值减去JND阈值,并将较低的高频DCT值置零,从而强化了美颜效果,同时降低了码率,增强用户体验。

Video Coding Algorithms for Beauty

【技术实现步骤摘要】
用于美颜的视频编码算法
本专利技术涉及视频领域,特别涉及一种用于美颜的视频编码算法、装置、设备和存储介质。
技术介绍
随着网络直播、短视频的流行,人们对于传统的视觉效果已经不再关注,人们更多关注的是美化过后的视频,人们也更愿意看到更美的自己展现在观众的视线里,而传统的视频压缩方法由于其美颜效果不佳以及码率较高,显然已经不再适用。
技术实现思路
本专利技术的目的在于至少解决现有技术中存在的技术问题之一,提供一种用于美颜的视频编码算法、装置、设备和存储介质,不仅能够强化美颜效果,而且还能够降低码率,增强用户体验。本专利技术的第一方面,提供一种用于美颜的视频编码算法,包括以下步骤:对视频文件中的人脸五官以及额头位置进行定位,获得人脸框;对所述人脸五官的区域进行美化处理;对所述视频文件的每一帧图片进行DCT变换,获得每一帧图片的DCT值,并根据所述每一帧图片的DCT值计算出每一帧图片的JND阈值;将所述每一帧图片的DCT值减去所述每一帧图片的JND阈值,获得每一帧图片新的DCT值;根据每一帧图片新的DCT值进行DCT反变换,获得每一帧新的图片;根据所述人脸框找到对应所述每一帧新的图片中的CTU;对ROI区域和非ROI区域进行QP赋值。上述用于美颜的视频编码算法至少具有以下有益效果:本专利技术首先找到人脸和五官的位置,然后对五官进行美化,继而采用JND的DCT域方法,得到每一帧的DCT的JND域值,将每一帧的DCT值减去JND阈值,并将较低的高频DCT值置零,从而强化了美颜效果,同时降低了码率,增强用户体验。根据本专利技术第一方面所述的用于美颜的视频编码算法,所述对视频文件中的人脸五官以及额头位置进行定位,获得人脸框,包括:采用ERT算法对人脸五官位置进行定位,并采用椭圆画法输出额头位置。根据本专利技术第一方面所述的用于美颜的视频编码算法,所述对所述人脸五官进行美化处理,包括:通过增大所述人脸五官的区域的亮度值来进行美白处理;通过增大所述人脸五官的区域的纯度来进行鲜艳度处理;通过在BGR空间采用高斯滤波和双边滤波算法对所述人脸五官的区域进行磨皮处理;采用卷积锐化算法对所述人脸五官的区域进行锐化处理。根据本专利技术第一方面所述的用于美颜的视频编码算法,所述对所述视频文件的每一帧图片进行DCT变换,获得每一帧图片的DCT值,并根据所述每一帧图片的DCT值计算出每一帧图片的JND阈值,包括:所述每一帧图片设置为8*8块的预处理单位。本专利技术的第二方面,提供一种视频编码装置,包括:定位单元,用于对视频文件中的人脸五官以及额头位置进行定位,获得人脸框;美化处理单元,用于对所述人脸五官的区域进行美化处理;JUN阈值计算单元,用于对所述视频文件的每一帧图片进行DCT变换,获得每一帧图片的DCT值,并根据所述每一帧图片的DCT值计算出每一帧图片的JND阈值;DCT值计算单元,用于将所述每一帧图片的DCT值减去所述每一帧图片的JND阈值,获得每一帧图片新的DCT值;DCT反变换单元,用于根据每一帧图片新的DCT值进行DCT反变换,获得每一帧新的图片;CTU获取单元,用于根据所述人脸框找到对应所述每一帧新的图片中的CTU;QP赋值单元,用于对ROI区域和非ROI区域进行QP赋值。上述视频编码装置至少具有以下有益效果:本专利技术首先找到人脸和五官的位置,然后对五官进行美化,继而采用JND的DCT域方法,得到每一帧的DCT的JND域值,将每一帧的DCT值减去JND阈值,并将较低的高频DCT值置零,从而强化了美颜效果,同时降低了码率,增强用户体验。本专利技术的第三方面,提供一种视频编码设备,包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行如上述第一方面的用于美颜的视频编码算法。上述视频编码设备至少具有以下有益效果:本专利技术首先找到人脸和五官的位置,然后对五官进行美化,继而采用JND的DCT域方法,得到每一帧的DCT的JND域值,将每一帧的DCT值减去JND阈值,并将较低的高频DCT值置零,从而强化了美颜效果,同时降低了码率,增强用户体验。本专利技术的第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如上述第一方面的用于美颜的视频编码算法。上述计算机可读存储介质至少具有以下有益效果:本专利技术首先找到人脸和五官的位置,然后对五官进行美化,继而采用JND的DCT域方法,得到每一帧的DCT的JND域值,将每一帧的DCT值减去JND阈值,并将较低的高频DCT值置零,从而强化了美颜效果,同时降低了码率,增强用户体验。附图说明下面结合附图和实例对本专利技术作进一步说明。图1是本专利技术一个实施例所提供的用于美颜的视频编码算法的流程图;图2是本专利技术一个实施例所提供的视频编码设备的结构图。具体实施方式本部分将详细描述本专利技术的具体实施例,本专利技术之较佳实施例在附图中示出,附图的作用在于用图形补充说明书文字部分的描述,使人能够直观地、形象地理解本专利技术的每个技术特征和整体技术方案,但其不能理解为对本专利技术保护范围的限制。在本专利技术的描述中,需要理解的是,涉及到方位描述,例如上、下、前、后、左、右等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。在本专利技术的描述中,若干的含义是一个或者多个,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。本专利技术的描述中,除非另有明确的限定,设置、安装、连接等词语应做广义理解,所属
技术人员可以结合技术方案的具体内容合理确定上述词语在本专利技术中的具体含义。随着网络直播、短视频的流行,人们对于传统的视觉效果已经不再关注,人们更多关注的是美化过后的视频,人们也更愿意看到更美的自己展现在观众的视线里,而传统的视频压缩方法由于其美颜效果不佳以及码率较高,显然已经不再适用。基于此,本专利技术提供了一种用于美颜的视频编码算法、装置、设备和存储介质,首先找到人脸和五官的位置,然后对五官进行美化,继而采用JND的DCT域方法,得到每一帧的DCT的JND域值,将每一帧的DCT值减去JND阈值,并将较低的高频DCT值置零,从而强化了美颜效果,同时降低了码率,增强用户体验。参照图1,本专利技术第一方面的一个实施例,提供了一种用于美颜的视频编码算法,包括以下步骤:S1:对视频文件中的人脸五官以及额头位置进行定位,获得人脸框;S2:对所述人脸五官的区域进行美化处理;S3:对所述视频文件的每一帧图片进行DCT变换,获得每一帧图片的DCT值,并根据所述每一帧图片的DCT值计算出每一帧图片的JND阈值;具体表现为:采用DCT变换计算每一帧的DCT值,DCT域中的JND通常为基准阈值与提高因子的乘积,tJND(n1,n2,i,j)=tb(n1,n2,i,j)×ae(n本文档来自技高网
...

【技术保护点】
1.一种用于美颜的视频编码算法,其特征在于,包括以下步骤:对视频文件中的人脸五官以及额头位置进行定位,获得人脸框;对所述人脸五官的区域进行美化处理;对所述视频文件的每一帧图片进行DCT变换,获得每一帧图片的DCT值,并根据所述每一帧图片的DCT值计算出每一帧图片的JND阈值;将所述每一帧图片的DCT值减去所述每一帧图片的JND阈值,获得每一帧图片新的DCT值;根据每一帧图片新的DCT值进行DCT反变换,获得每一帧新的图片;根据所述人脸框找到对应所述每一帧新的图片中的CTU;对ROI区域和非ROI区域进行QP赋值。

【技术特征摘要】
1.一种用于美颜的视频编码算法,其特征在于,包括以下步骤:对视频文件中的人脸五官以及额头位置进行定位,获得人脸框;对所述人脸五官的区域进行美化处理;对所述视频文件的每一帧图片进行DCT变换,获得每一帧图片的DCT值,并根据所述每一帧图片的DCT值计算出每一帧图片的JND阈值;将所述每一帧图片的DCT值减去所述每一帧图片的JND阈值,获得每一帧图片新的DCT值;根据每一帧图片新的DCT值进行DCT反变换,获得每一帧新的图片;根据所述人脸框找到对应所述每一帧新的图片中的CTU;对ROI区域和非ROI区域进行QP赋值。2.根据权利要求1所述的一种用于美颜的视频编码算法,其特征在于,所述对视频文件中的人脸五官以及额头位置进行定位,获得人脸框,包括:采用ERT算法对人脸五官位置进行定位,并采用椭圆画法输出额头位置。3.根据权利要求1所述的一种用于美颜的视频编码算法,其特征在于,所述对所述人脸五官进行美化处理,包括:通过增大所述人脸五官的区域的亮度值来进行美白处理;通过增大所述人脸五官的区域的纯度来进行鲜艳度处理;通过在BGR空间采用高斯滤波和双边滤波算法对所述人脸五官的区域进行磨皮处理;采用卷积锐化算法对所述人脸五官的区域进行锐化处理。4.根据权利要求1所述的一种用于美颜的视频编码算法,其特征在于,所述对所述视频文件的每一帧图片进行DCT变换,获得每一帧图片的DCT值,并根据所述...

【专利技术属性】
技术研发人员:谭洪舟王双刘澍王军
申请(专利权)人:佛山市顺德区中山大学研究院广东顺德中山大学卡内基梅隆大学国际联合研究院中山大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1