【技术实现步骤摘要】
基于深度学习的人脸图像压缩方法及装置
本专利技术涉及图像处理
,尤其是涉及一种基于深度学习的人脸图像压缩方法及装置。
技术介绍
随着互联网技术的发展,以视频为主体的移动多媒体数据急剧增长,超过5G带宽增速,导致超高清视频业务面临研究挑战。在目前或者可见的将来,信息产生的体量和对应的传输技术在增长速度上会产生一定程度的脱节。数据规模的不断扩张,使其与无线带宽资源之间的矛盾日益突出。在全球新冠疫情期间,远程诊疗、远程探视、远程会议、远程办公等已经悄然成为常态,而人脸图像是相关业务的主要载体,目前大多采用JPEG2000视频编码标准进行人脸图像压缩,由于采用JPEG2000标准处理算法比较复杂,因此其处理每一帧人脸图像的时间较长,因而大幅提升人脸图像压缩效率仍然是难题。
技术实现思路
本专利技术的目的在于提供一种基于深度学习的人脸图像压缩方法及装置,以缓解现有技术中存在的压缩复杂度高、人脸图像压缩效率较低的技术问题。第一方面,本专利技术提供的一种基于深度学习的人脸图像压缩方法,其中,包括:基于平均 ...
【技术保护点】
1.一种基于深度学习的人脸图像压缩方法,其特征在于,包括:/n基于平均人脸图像和主动外观模型,将测试人脸图像分解为形状分量和纹理分量;/n利用量化熵编码器对所述形状分量进行编码压缩,得到第一压缩结果;/n利用训练好的卷积神经网络编码器对所述纹理分量进行编码压缩,得到第二压缩结果;/n将所述第一压缩结果和第二压缩结果确定为人脸图像压缩结果。/n
【技术特征摘要】
1.一种基于深度学习的人脸图像压缩方法,其特征在于,包括:
基于平均人脸图像和主动外观模型,将测试人脸图像分解为形状分量和纹理分量;
利用量化熵编码器对所述形状分量进行编码压缩,得到第一压缩结果;
利用训练好的卷积神经网络编码器对所述纹理分量进行编码压缩,得到第二压缩结果;
将所述第一压缩结果和第二压缩结果确定为人脸图像压缩结果。
2.根据权利要求1所述的方法,其特征在于,基于平均人脸图像和主动外观模型,将测试人脸图像分解为形状分量和纹理分量,包括:
获取平均人脸图像的预设标志点坐标;
将所述测试人脸图像输入至所述主动外观模型,得到测试人脸图像的面部标志点坐标;
基于所述测试人脸图像的面部标志点坐标和所述平均人脸图像的预设标志点坐标,确定测试人脸图像的预设标志点坐标;
基于测试人脸图像的预设标志点坐标,确定所述形状分量;
基于所述形状分量与纹理分量之间的预设关系和所述形状分量,确定所述纹理分量。
3.根据权利要求1所述的方法,其特征在于,所述训练好的卷积神经网络编码器包括至少一个卷积块,每个所述卷积块包括:至少一个卷积层、至少一个池化层和第一激活层;
利用训练好的卷积神经网络编码器对所述纹理分量进行编码压缩,得到第二压缩结果,包括:
将所述纹理分量输入至所述训练好的卷积神经网络编码器,经所述卷积层、所述池化层和所述第一激活层学习特征,得到特征图像;
将所述特征图像确定为所述第二压缩结果。
4.根据权利要求1所述的方法,其特征在于,在将所述第一压缩结果和第二压缩结果确定为人脸图像压缩结果之后,还包括:
利用反量化熵解码器对所述第一压缩结果进行解码,得到重建的形状分量;
利用训练好的反卷积神经网络解码器对所述第二压缩结果进行解码,得到重建的纹理分量;
将所述重建的形状分量和所述重建的形状分量进行融合,得到与所述测试人脸对应的重建人脸图像。
5.根据权利要求4所述的方法,其特征在于,所述训练好的反卷积神经网络解码器包括至少一个反卷积块,每个所述反卷积块包括:至少一...
【专利技术属性】
技术研发人员:段一平,陶晓明,胡舒展,刘永嘉,张栩铭,陆建华,
申请(专利权)人:清华大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。