视频会议中的面部识别和面部图像的传输制造技术

技术编号:11637219 阅读:96 留言:0更新日期:2015-06-24 11:42
本文的各个方面描述了由一个或多个摄影机接收一个或多个图像的新方法和新系统。一个或多个图像中的每个图像由一个或多个摄影机获得,在该一个或多个摄影机中一个或多个图像包含对应于人的面部图像。在一个实施例中,本公开的各个方面描述了用于从每个图像中提取每个面部图像的方法,在图像中每个面部图像对应于一个或多个所提取的面部图像的集合中的一个集合。该方法还包括根据每组将所提取的面部图像中的每个所提取的面部图像整理到一个或多个组中的独立的组中,其中每个组对应于每个人的面部图像。该方法还包括从一组或多组中的每组选出优选的面部图像以产生优选的图像,通过使用显示服务器,将优选的面部图像传输到客户端。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】视频会议中的面部识别和面部图像的传输相关申请的交叉引用本申请要求于2012年10月8日提交的序列号为13/647,205、题名为“在视频会议中的面部识别和面部图像的传输(Facial Recognit1n and Transmiss1n of FacialImages in a Videoconference) ”的美国专利申请的优先权,通过引用将它整体并入本申请。
本公开中所描述的各个方面涉及在一个房间中的一个或多个人的面部图像的捕捉、处理和传输。背景当视频会议在发生在多方之间时,往往难以确定谁正在发言。通常,发言人的面部被指定了房间的座位安排的相同房间内的另一个人挡住。此外,面部图像的大小可能是不同的,这取决于每个人与正在捕捉视频会议的摄影机的距离。另外,取决于摄影机的视场,一个或多个发言者的面部可能是模糊的导致很难准确地确定谁正在讲话。此外,摄影机捕捉视频会议中参与者的面部图像的角度可能导致一个或多个视频会议的参与者不期望的侧面或后部头像。因此,发送到另一方的视频可能提供很少或没有提供关于谁正在发言的信息。在视频会议期间,发言者的面部表情和嘴唇动作可能是部分不可见或全部不可见。这些面部表情和嘴唇动作确定正在发言的人或可以有助于更好的理解发言人所讲的话和他讲话时的表情。此外,发言者的面部表情也可以提供对他陈述的情感内容的理解(例如,发言者是高兴、愤怒、悲伤、兴奋等)。因此,多方之间通过视频会议呼叫的通信可能会遇到不能够看到发言者的面部图像的情况。此外,如果发言者移动到摄影机视场范围内的房间中的另一个人的后面,那么摄影机可能不能继续捕捉发言者的图像。因此,在这种情况下,发言者可能彻底的从视频会议中消失,并且发言者的嘴唇动作可能不能够被摄影机捕捉到。因此,基于以上内容,在从一方到一方或从一方到其它更多方的视频会议呼叫中存在提供捕捉、处理和传输面部图像的视图的更好的方法的需求。概述根据前述的背景,以下提出本公开的简要概述以便提供对本专利技术中所描述的一些方面的基本的理解。本概述不是综述的扩展,并不是意图识别关键或重要元素或划定权利要求的范围。下面的概述仅仅以简要的形式提出各种所描述的方面作为下面所提供的更详细的描述的序目。为了阐述上述缺点和将通过阅读本公开认识到的另外的益处,本文说明性的各个方面的各个方面描述了用于捕捉、处理和从主机向客户端传输参与者的面部图像的新方法和新系统。说明性实施例的各个方面基本上在至少一个下面的图中示出和/或结合至少一个下面的图进行了描述,同时在权利要求中更全面的进行阐述。本公开的这些和其他优点、各个方面和新颖的特征,还有其中所说明的实施例的细节将从下面的描述和附图中得到更充分地理解。【附图说明】已经以通用的术语如此描述了本公开的多个方面,现在将参考附图,这些附图不需要按照比例绘制,并且其中:图IA示出了本公开的各个方面可以被实现在其中的操作环境。图IB示出了来自根据图IA中说明的说明性的操作环境的摄影机的透镜(perspective)的视场。图IC示出了在由根据图IA中说明的说明性的操作环境的摄影机所捕捉的图像内识别或检测面部图像。图ID示出了根据图IA中说明的说明性的操作环境的、参与者的面部图像已经被归一化之后的参与者的面部图像。图IE示出了根据图IA中说明的说明性的操作环境,分类(collating)和和/或整理(sorting)参与者的归一化的面部图像。图IF示出了根据图IA中说明的说明性的操作环境,将参与者的归一化的面部图像定位或布置到输出网格图案中。图2A示出了本公开的各个方面可以在其中实现的示例性操作环境。图2B示出了从由根据图2A中说明的说明性的操作环境的第一摄影机捕捉的图像采集的面部图像。图2C示出了从由根据图2A中说明的说明性的操作环境的第二摄影机捕捉的图像采集的面部图像。图2D示出了从由根据图2A中说明的说明性的操作环境的第三摄影机捕捉的图像采集的面部图像。图2E示出了由根据图2A中说明的说明性的操作环境的第一摄影机所捕捉的、选出的面部图像的归一化。图2F示出了由根据图2A中说明的说明性的操作环境的第二摄影机所捕捉的、选出的面部图像的归一化。图2G示出了由根据图2A中说明的说明性的操作环境的第三摄影机所捕捉的、选出的面部图像的归一化。图2H示出了对由根据图2A中说明的说明性的操作环境的每个摄影机所捕捉的面部图像进行整理和处理。图21示出了根据图2A中说明的说明性的操作环境,将参与者的归一化的面部图像定位或布置到空间图案中。图2J示出了根据图2A中说明的说明性的操作环境,将参与者的归一化的面部图像定位或布置到输出网格图案中。图3示出了对应于结合根据本公开的一个或多个说明性实施例的图IA和2A中的每个图所示的每个计算设备的通用计算设备的一个示例框图。图4是说明在根据本专利技术的说明性实施例的主机处的一个或多个摄影机如何捕捉、处理和传输一个或多个面部图像到客户端的操作流程图。详细说明下面的各种实施例的描述参考了附图,附图形成了描述的一部分,并且在附图中通过图示的方式说明了各种实施例,在各种实施例中可以实践所描述的各个方面。应该理解的是,在不违背本公开的范围和精神的前提下,可以利用其它实施例,并且可以做结构和功能的修改。正如本领域技术人员在阅读了以下公开所理解的,本公开中所描述的各个方面可以体现为方法、数据处理系统或仪器、或计算机程序产品。因此,这些方面可以采取纯硬件实施例、纯软件实施例或软件方面和硬件方面结合的实施例的形式。此外,这样的方面可以采取由一个或多个计算机可读储存介质所储存的计算机程序产品的形式,其中计算机可读储存介质具有体现在储存介质中或体现在储存介质上的计算机可读程序编码或指令。可以利用任何合适的计算机可读储存介质,包括硬盘驱动器、光盘(诸如CD和DVD)、和/或其他光学介质或光学驱动器、NAS(网络附加的储存器)设备、和/或任何它们的组合。此外,各种信号,诸如一个或多个数字信号,可以包括可在计算设备间传输的数据(未编码的数据、编码的数据或加密的数据)。计算设备可以包括一个或多个计算机(例如,PC、台式计算机、笔记本计算机)、一个或多个便携式无线计算设备(例如,无线电话、PDA、笔记本计算机、平板电脑)或包含能够执行固件和/或软件的处理器和存储器的任何一种计算设备。图IA示出了本公开的各个方面可以在其中被实现的示例操作环境。该操作环境包括一个或多个人/参与者136、一个或多个人/参与者136围绕的会议室桌子132、显示器/电视/监视器140、摄影机104、计算设备112、局域网(LAN) 124、广域网(WAN) 128和互联网120。虽然图IA示出了单个计算设备112,在其它实施例中,单个计算设备112可以被两个或多于两个协同工作的计算设备代替以提供本公开所描述的功能。示例性的实施例说明了来自操作环境顶部的视图。在这个示例性的实施例中,摄影机104位于如所示的显示器140的顶部,但是它可以位于参与者前面的任何地方。摄影机104可以位于任何合适的高度以便允许所有参与者136的面部的清晰的视图。摄影机140可以位于提供房间内的参与者向下的视场的高度。在可代替的实施例中,显示器140可以包含摄影机104。摄影机140可被集成到本文档来自技高网...

【技术保护点】
一种系统,包括:一个或多个摄影机;至少一个处理器;以及至少一个存储器,所述至少一个存储器用于存储计算机可执行指令,其中,所述计算机可执行指令由所述至少一个处理器执行,将引起所述系统执行包括下列操作的方法:通过所述一个或多个摄影机中的每个摄影机接收一个或多个图像,其中,所述一个或多个图像中的每个图像包括对应于一个或多个人的一个或多个面部图像,所述一个或多个图像中的所述每个图像对应于所述一个或多个摄影机中的每个摄影机;从所述一个或多个图像中的每个图像提取所述一个或多个面部图像中的每个面部图像以产生所提取的面部图像的一个或多个集合;按所述一个或多个集合中的每个集合将一个或多个所提取的面部图像中的每个所提取的面部图像整理到一个或多个组中的独立的组中,其中,所述一个或多个组中的每个组对应于所述一个或多个人中的每个人的面部图像;从所述一个或多个组中的每个组中选出优选的面部图像以产生一个或多个优选的面部图像;以及传输所述一个或多个优选的面部图像到显示服务器。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:雅各布·贾瑞德·萨默斯
申请(专利权)人:思杰系统有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1