具有三维感知的视频通信制造技术

技术编号：11076858 阅读：72 留言：0更新日期：2015-02-25 15:08

一般地，本公开通过基于标识、切分和跟踪图像的前景和背景层所生成的视差效应来提供用于具有三维感知图像呈现的实时视频通信的方法和系统。所述系统可包括：图像切分模块，配置成将当前本地视频帧分为本地前景层和本地背景层，并且基于本地前景层和本地背景层之间估计的边界来生成本地前景掩模，其中，当前本地视频帧包括本地颜色视频图像帧和本地图像深度数据帧；面部跟踪模块，配置成基于当前本地视频帧以及一个或多个先前本地视频帧来跟踪本地用户的面部的位置；背景层估计模块，配置成估计与从远程视频处理器接收的当前远程视频帧和远程前景掩模关联的远程背景层；以及图像呈现模块，配置成基于所估计的远程背景层、从远程视频处理器接收的当前远程视频帧和远程前景掩模、以及本地用户的面部的所跟踪的位置来呈现3D感知图像。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】具有三维感知的视频通信
本公开涉及实时视频通信，并且更具体地涉及具有三维感知的实时视频通信。
技术介绍
例如各自在计算机上的本地用户和远程用户之间的视频通信变得日益常见和可用。这归因于内置视频摄像机和麦克风的个人计算机的流行以及高速互联网连通性的日益可用性。但是，由于通常与三维（3D)成像关联的所增加的硬件复杂性，大多数视频通信限于提供二维（2D)屏幕图像。这些复杂性可包括使用双摄像机、具有同步和校准的昂贵显示技术和难度。但是，3D视频通信是值得期望的。深度感知向用户提供视觉提示，并且这些提示可增强与通信体验关联的空间和现实的感觉。如果能够以减少的成本并且无需对诸如第二摄像机或复杂显示器之类的附加硬件的要求来提供深度感知，则可由此增加用户体验的质量和满意。【附图说明】随着下面的详细描述继续并且在参考附图时，所要求保护的主题的实施例的特征和优点将变得明显，在附图中，相似的标号描绘相似的部分，并且其中：图1示出与本公开一致的视频通信系统的一个示范性实施例的顶级系统图；图2示出与本公开一致的视频通信系统的一个示范性实施例的框图；图3示出与本公开一致的示范性实施例的前景切分（segmentation)模块的附加框图细节；图4示出与本公开的示范性实施例一致的前景掩模(mask)和边界轮廓；图5示出与本公开一致的示范性实施例的背景估计模块的附加框图细节；图6示出与本公开一致的示范性实施例的操作的流程图。虽然下面的详细描述将通过对说明性实施例进行参考来继续，但是本领域技术人员将明白其许多的...
具有三维感知的视频通信

【技术保护点】
一种用于生成三维(3D)感知的方法，所述方法包括：将当前本地视频帧切分为本地前景层和本地背景层；基于所述本地前景层和所述本地背景层之间估计的边界来生成本地前景掩模；将所述当前本地视频帧和所述本地前景掩模传送到远程视频处理器，所述远程视频处理器配置成基于所述当前本地视频帧和所述本地前景掩模来呈现3D感知图像；从所述远程视频处理器接收当前远程视频帧和远程前景掩模；跟踪本地用户的面部的位置，所述跟踪基于所述当前本地视频帧以及一个或多个先前本地视频帧；基于所述当前远程视频帧和所述远程前景掩模来估计远程背景层；以及基于所述估计的远程背景层、所述远程前景掩模、所述当前远程视频帧和所述本地用户的面部的所述跟踪的位置来呈现3D感知图像。

【技术特征摘要】
【国外来华专利技术】2012.07.30 US 13/5611311. 一种用于生成三维（3D)感知的方法，所述方法包括：将当前本地视频帧切分为本地前景层和本地背景层；基于所述本地前景层和所述本地背景层之间估计的边界来生成本地前景掩模；将所述当前本地视频帧和所述本地前景掩模传送到远程视频处理器，所述远程视频处理器配置成基于所述当前本地视频帧和所述本地前景掩模来呈现3D感知图像；从所述远程视频处理器接收当前远程视频帧和远程前景掩模；跟踪本地用户的面部的位置，所述跟踪基于所述当前本地视频帧以及一个或多个先前本地视频帧；基于所述当前远程视频帧和所述远程前景掩模来估计远程背景层；以及基于所述估计的远程背景层、所述远程前景掩模、所述当前远程视频帧和所述本地用户的面部的所述跟踪的位置来呈现3D感知图像。2. 如权利要求1所述的方法，其中，所述当前本地视频帧包括本地颜色视频图像帧和本地图像深度数据帧，并且其中，所述传送所述当前本地视频帧包括传送所述本地颜色视频图像帧。3. 如权利要求2所述的方法，其中，所述生成所述本地前景掩模还包括基于所述本地图像深度数据帧来生成粗略前景掩模，并且还包括基于所述粗略前景掩模和所述本地颜色视频图像帧来生成精制的前景掩模。4. 如权利要求3所述的方法，其中，所述生成所述粗略前景掩模还包括去噪过滤、阈值化和连接分量分析。5. 如权利要求3所述的方法，其中，所述生成所述精制的前景掩模还包括层绑定、图裁剪处理和平滑过滤。6. 如权利要求1、4或5所述的方法，其中，所述呈现还包括基于所述远程前景掩模从所述当前远程视频帧提取远程前景层，并且合成所述提取的远程前景层和所述估计的远程背景层，其中，所述提取的远程前景层被定位在相对于所述估计的远程背景层的偏移，所述相对的偏移基于所述本地用户的面部的所述跟踪的位置。7. 如权利要求6所述的方法，其中，所述估计的远程背景层被定位在第一偏移， O/ = +1 ,并且所述提取的远程前景层被定位在第二偏移，认=今％其中，ii是包括与所述本地用户的面部位置的所述跟踪的位置关联的方向和距离的运动向量，fc是O到1 的范围中的比例因子，并且％是O到1的范围中的比例因子。8. 如权利要求7所述的方法，其中，％> ,并且选择％和知以在所述呈现的3D感知图像中生成视差。9. 一种用于生成三维（3D)感知的系统，所述系统包括：图像切分模块，配置成将当前本地视频帧切分为本地前景层和本地背景层，并且基于所述本地前景层和所述本地背景层之间估计的边界来生成本地前景掩模，其中，所述当前本地视频帧包括本地颜色视频图像帧和本地图像深度数据帧；面部跟踪模块，配置成基于所述当前本地视频帧以及一个或多个先前本地视频帧来跟踪本地用户的面部的位置；背景层估计模块，配置成估计与从远程视频处理器接收的当前远程视频帧和远程前景掩模关联的远程背景层；以及图像呈现模块，配置成基于所述估计的远程背景层、从所述远程视频处理器接收的所述当前远程视频帧和所述远程前景掩模、以及所述本地用户的面部的所述跟踪的位置来呈现3D感知图像。10. 如权利要求9所述的系统，其中，所述图像切分模块还包括配置成基于所述本地图像深度数据帧来生成粗略前景掩模的粗略切分模块，并且还包括配置成基于所述粗略前景掩模和所述本地颜色视频图像帧来生成精制的前景掩模的边界精制模块。11. 如权利要求10所述的系统，其中，所述粗略切分模块还包括去噪过滤模块、耦合到所述去噪过滤模块的阈值化模块以及耦合到所述阈值化模块的连接...

【专利技术属性】
技术研发人员：Y吴，W孙，MM楚，E德雷沙，P穆斯，LB艾恩斯沃思，G舍马克，IV科津特塞夫，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人