低比特率视频通话中基于模型和对象的头肩图像重建方法技术

技术编号：12309505 阅读：128 留言：0更新日期：2015-11-11 18:18

低比特率视频通话中基于模型和对象的头肩图像重建方法，其特征在于，结合基于对象编码和基于模型编码二者的优点，提出的一种同时基于对象和模型的低比特率混合编码方法，这种方法对人脸区域进行2D可变形模型自动训练，然后编码，对头肩的区域采用一个基于Delaunay算法形成的2D网格，并使用网格迭代使其与头部图像匹配较好，然后对图像进行JPEG2000压缩得到对象纹理，将对象网格和对象纹理经信道传输到接收端共享然后编码。这种方法经过网格分割和纹理压缩具有很高的编码效率，同时具有较好的用户体验。它实现了头肩视频在低比特率中的传输，重建视频图像后仍有很好地体验效果，从而提高了通信资源的利用率。

全部详细技术资料下载

【技术实现步骤摘要】
低比特率视频通话中基于模型和对象的头肩图像重建方法
本专利技术涉及视频传输领域，特别是在低比特率情况下的一种多媒体通信时人脸视频的头肩部分的图像重建方法。结合基于对象编码和基于模型编码二者的优点，提出的一种同时基于对象和模型的低比特率混合编码方法(Model-and-ObjectbasedCoding，MOBC)，它实现了头肩视频在低比特率中的传输，重建视频图像后仍有很好的体验效果，从而提高了通信资源的利用率。
技术介绍
近年来无线网络中的基于多媒体业务的数据流急速上升，诸如视频通话、视频会议等多媒体通信应用出现在大量的移动设备中。但是，传统的基于块的混合视频编码技术为了要达到较为满意的通话质量需要比较高的比特率，压缩效率较低，这使无线网络很难承载迅速增长的大量视频数据。由于无线链路的带宽资源成本非常高，因此，需要在保证较好的用户体验质量(Quality-of-Experience，QoE)同时，找到一种更有效的编码方法来减少移动视频传输所需要的带宽。目前已经有大量这方面的研究工作。为了克服传统的基于分块的编码方法的缺点，研究人员提出了基于兴趣区域的编码方法。基于兴趣区域的编码方式假设，为了提高用户体验，对用户感兴趣的视频区域的质量相对于视频其他区域的质量更加重要。对典型的多媒体通信视频电话和视频会议而言，说话者的头部和上身通常是观察者最感兴趣的。目前已有一种模型辅助方法，即先检测通信者的头肩部分，然后编解码调整比特分配方案，将更多的比特分配到头肩部分，从而在没有需要更多带宽的情况下提高了兴趣区域的视频质量。这些方法提供的视频压缩比率有限，特别的，对于可视...
低比特率视频通话中基于模型和对象的头肩图像重建方法

【技术保护点】
低比特率视频通话中基于模型和对象的头肩图像重建方法，其特征在于，是在由通信各方的移动设备借助基站构成的、供低比特率视频通话用的移动视频通信系统中依次按以下步骤实现的：视频图像发送端，以下简称发送端，依次执行以下步骤：步骤(1)，获取发送方的第一帧人脸视频，用Regularized Landmark Mean‑Shift，简称RLMS的正则化的人脸关键坐标点定位方法进行人脸定位，得到估计的人脸关键坐标点位置hi＝(xi，yi)的最小边缘，称为脸矩形，x，y为人脸视频图像中关键坐标点的位置，i为关键坐标点的序号，总数共68个，h为坐标点，步骤(2)，根据步骤(1)得到的脸矩形估计涵盖头部的头矩形和涵盖肩部的肩矩形：步骤(2.1)，估计头矩形：将所述脸矩形的上缘向上提高一个脸矩形的高度，并将所述脸矩形的左缘和右缘各向左、右扩展一个所述脸矩形的宽度的一半，得到所述头矩形，步骤(2.2)，估计肩矩形：以所述脸矩形的下缘为上缘，所述第一帧视频图像的下缘为下缘，并将所述头矩形的左缘和右缘各自向左、右两个方向扩展所述脸矩形宽度的一半，得到肩矩形，所述头矩形和肩矩形视为头肩可能存在的区域，步骤(3)，利...

【技术特征摘要】
1.低比特率视频通话中基于模型和对象的头肩图像重建方法，其特征在于，是在由通信各方的移动设备借助基站构成的、供低比特率视频通话用的移动视频通信系统中依次按以下步骤实现的：视频图像发送端，以下简称发送端，依次执行以下步骤：步骤(1)，获取发送方的第一帧人脸视频图像，用RegularizedLandmarkMean-Shift，简称RLMS的正则化的人脸关键坐标点定位方法进行人脸定位，得到估计的人脸关键坐标点位置hi＝(xi，yi)的最小边缘，称为脸矩形，x，y为人脸视频图像中关键坐标点的位置，i为关键坐标点的序号，总数共68个，h为坐标点，步骤(2)，根据步骤(1)得到的脸矩形估计涵盖头部的头矩形和涵盖肩部的肩矩形：步骤(2.1)，估计头矩形：将所述脸矩形的上缘向上提高一个脸矩形的高度，并将所述脸矩形的左缘和右缘各向左、右扩展一个所述脸矩形的宽度的一半，得到所述头矩形，步骤(2.2)，估计肩矩形：以所述脸矩形的下缘为上缘，以所述第一帧人脸视频图像的下缘为下缘，并将所述头矩形的左缘和右缘各自向左、右两个方向扩展所述脸矩形宽度的一半，得到肩矩形，所述头矩形和肩矩形视为头肩可能存在的区域，步骤(3)，利用基于L0梯度最小化的图像平滑方法对所述第一帧视频图像，简称图像，进行平滑滤波，步骤(4)，以所述头肩可能存在的区域为初始区域，用Grabcut图像分割算法找到头肩区域的边界，同时，对所述图像进行JPEG2000压缩，得到对象纹理；步骤(5)，构建步骤(4)得到的所述头肩区域的三角形密集网格：步骤(5.1)，以步骤(4)得到的所述头肩区域中的每一个像素点作为一个三角形网格的顶点，使用Delaunay算法对所述头肩区域进行三角剖分，生成密集的三角网格，步骤(5.2)，用一个矩阵TN×3表示所述的三角形密集网格，简称网格，其中：N为顶点数，用顶点的坐标位置向量m＝{(x1，y1)，...，(xn，yn)，...，(xN，yN)}表示，在数值上N等于所述矩阵TN×3的行数，每一行n的三个整数{a，b，c}代表序号为a，b，c的三个顶点在所述网格中组成一个子三角形，n＝1，2，..，N，步骤(6)，对所述网格进行网格迭代简化，使最终的网格顶点数少于100个：步骤(6.1)，将所述网格中所有顶点标记为可以删除的顶点，步骤(6.2)，网格边界上的顶点的简化：步骤(6.2.1)，对于所述网格边界上相邻的任意三个点，按下式求得从中间点(xi，yi)到其余两点(xi-1，yi-1)和(xi+1，yi+1)连成的直线y＝kx+b的垂直距离d：步骤(6.2.2)，判断d是否≥1：若：d≥1，且所述点(xi，yi)标记为可以删除的顶点，则从所述网格中把所述点(xi，yi)删去，并将在所述网格中所有与所述点(xi，yi)相连的其它所述网格顶点标记为不允许删除的点，若：d＜1，则保留，步骤(6.2.3)，从网格边界上任选一点作为所述中间点开始，沿着所选网格边界依次执行步骤(6.2.1)～步骤(6.2.2)，一直到网格边界上的每一点全部执行完为止，得到顶点较少的初始网格，步骤(6.3)，所述网格内部的简化，是指简化不在网格边界上的内部网格顶点：步骤(6.3.1)，按下式计算所有所述内部网格顶点的显著性...

【专利技术属性】
技术研发人员：陶晓明，卢继川，李扬，葛宁，陆建华，
申请(专利权)人：清华大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人