当前位置: 首页 > 专利查询>宝利通公司专利>正文

在点对点和多点音频/视频会议期间显示动态呼叫者身份制造技术

技术编号:4143770 阅读:387 留言:0更新日期:2012-04-11 18:40
本申请涉及在点对点和多点音频/视频会议期间显示动态呼叫者身份。本申请提出了一种用于有效确定并显示通过多个输入和计算的参数而确定的与视频会议呼叫相关联的有关信息的方法。使用在整个视频会议期间来自于终端处的用户输入以及计算的信息来向所有与会者呈现关于当前发言的人的个人信息,从而执行该用于有效确定并显示此个人信息的方法。视频会议系统一般由多个地点处的多个人使用。本申请的方法允许更多的用户交互以及在与会者中间的知识传输。通过在不同的地点之间共享信息,与会者更多地知道在任何给定时间谁正在发言并且知道该特定的人所说的话的重要性。

【技术实现步骤摘要】

本申请一般涉及视频会议领域。更具体而非限制性地,本申请涉及在视频会议环境中识别当前发言者以及在信息框中呈现关于当前发言者的信息的方法。
技术介绍
在现代商业组织中,具有地理上分散的个人的团体参加视频会议而不是面对面开会并不少见。公司和组织越来越多地使用视频会议来减少差旅费并且节省时间。但是,视频会议系统不能完美地模拟与会者在典型的与其它与会者面对面开会期间可能期待的那样,这可能会抵消掉财务和时间上的节省。在视频会议期间会显著缺少面对面会议的与会者自身低估了其价值(take for granted)的重要的感觉信息,而这阻碍了有效且高效的交流。 由于视频会议系统的性质,经由视频会议链接的不同的会议地点通常包含多个与会者。在这样的情况下,可能有利的是倾听的与会者识别发言的与会者,因此他能将他正在接收的听觉信息放到背景(context)中。发言的对话根据发言者可以具有不同的意义或重要性。不幸的是,常常是这样的情况由于使用的视频会议技术的限制,与会者对发言者的识别被推迟或变得不可能。例如,视频屏幕可能太小或质量很差,因而与会者可能不能感知远程与会者的嘴唇的运动或他的身体语言。此外,声音的方向性可能会丢失,因为它是在远程位置被再现的。
技术实现思路
在一个实施例中,本申请提供了一种在多方多地点视频会议或仅有音频和视频的混合的会议中确定并显示个人信息以帮助其它与会者的方法。在会议期间,不同的人将在不同的时间发言,并且可以通过检测在视频会议的终端处的音频输入并使用它识别当前谁正在发言,来识别当前发言的与会者。 一被识别出来,就可以将与被识别的人相关联的个人信息提供给会议的其它终端,作为对在这些其它终端处的与会者的帮助。例如,如果他们不具有对那人的识别特征的个人认识,则将为他们呈现当前发言的与会者的姓名和头衔。 在另一个实施例中,存储多种识别信息,以努力增大自动识别当前发言的与会者的准确度。在此实施例中,独立地处理不同类型识别信息中的每一个,并且比较独立处理的结果以在提供个人信息之前确定是否已经找到一致的结果。另外,如果没有获得一致的结果,则可能让呼叫主持人(call moderator)输入识别信息,并且此更新的识别信息随后可以用于提高未来自动识别的准确度。附图说明 图1示出了具有多个地点和可能正在视频会议中的多个与会者的示例公司。 图2以示例形式示出了在多方、多地点视频会议的一个或多个地点定义会议与会者的过程。 图3以示例形式示出了识别视频会议的当前发言的与会者的过程。5 图4示出了识别视频会议的当前发言的与会者的可替换实施例。 图5示出了视频会议系统的一个实施例的框图。具体实施例方式在典型的面对面会议中,倾听的与会者确定哪一个与会者当前正在发言通常是直接且容易的。需要一种在视频会议的背景下模拟此常规识别任务的视频会议系统。但是,即使倾听的与会者能够辨别哪个人正在发言,他也可能不知道发言者的姓名和头衔。还需要一种在视频会议环境中呈现当前发言者的个人识别信息的系统。 本申请公开了满足这些需要并且包括其它有利特征的方法和系统。在特定的实施例中,将视频会议设备描述为基于用户定义的输入参数结合计算的识别参数来呈现当前发言者的个人信息。计算的识别参数包括但不限于,通过语音识别和/或人脸识别软件、定向传声器及其它环境感测技术获得的参数。 以下本申请还描述了用于在视频会议系统的背景下识别并呈现关于当前发言者的个人信息的方法和系统。本领域技术人员将理解,可以将本申请的专利技术性质延伸到其它类型的在社区或商业组织(诸如,共享的工作空间、虚拟会议室和在线社区)之间共享的多用户通信技术。请注意,尽管用视频会议来描述本申请的专利技术性质,但是它也可以应用于仅有音频的会议、遥现、即时消息等。 在现代商业组织中,具有地理上分散的个人的团体参加同时发生的音频会议、视频会议或两者的结合并不少见。例如,参考图l,在配置100中示出了企业A,其具有位于纽约(105)、休斯顿(110)和特拉华(115)的办公室。企业A经由通过网络170连接的视频会议来举行每月的、企业范围的状态会议。每个地点安装有扬声器电话(185)、摄像机(181)和显示设备(180、180a)。在这样的会议期间,当前视频会议系统允许地理上分散的与会者看见并听见他们的远程的同事,但是若干限制可能妨碍体验的有效性。 第一,与会者确定谁正在远程地点发言可能是困难的。当前系统常常自动显示发言者所在的地点的名称,并且放大从该地点供给的视频,但是由于视频和音频再现方面的限制,远程与会者仍然可能不能辨别发言者的身份。因而,可以提醒(alert)休斯顿的会计(150)他正听到的声音来自于在纽约的企业总部中的人,但是它属于谁可能是未知的。没有此信息的话,远程与会者可能无法区别CE0(120)的发言与会计(130)的发言,因为CE0(120)和会计(130) 二者处于相同的地点。这样的方案明显不是最佳的。 第二,在较大的公司中,即使与会者可以识别出发言者,他也可能不知道他的姓名和头衔。此外,为了最佳地参与会议,每个与会者知道在纽约发言的未知面孔的人属于同级还是上级(例如,副总裁125)会是有利的。通过自动显示发言的与会者的个人信息,可以消除上述缺陷,并且视频会议可以更有效地模拟面对面会议并且或许甚至提供一些不用科技帮助就不可用的附加信息。所显示的个人信息可以包括但不限于姓名、头衔、位置及其它与会议有关的信息。 可以用各种方式来实现点对点和多点视频会议期间的发言者身份的显示。在一个实施例中,大量的设备和技术一齐工作以实现及时的发言者识别。例如,视频捕获设备和定向传声器向处理系统发送环境数据,该处理系统依靠与会者信息的储存库而运行语音识别和人脸识别软件。此外,一个或多个地点处的主持人可以监视所显示的个人信息的准确度,6并且在错误的情况下,对在处理系统中获得的结果进行校正。此外,学习算法可以分析这些 校正,从而增大未来的准确度。 这里所用的视频会议可以是被配置为便于一群人之间同时通信的一个或多个 终端的任意组合。这包括其中一些与会者地点仅仅通过音频连接来连接而其它与会者地点 通过音频与视频连接来连接的会议。在这样的情况下,可以预见,在发言之后,将向配备有 视频能力的地点显示仅有音频的与会者的个人信息。在一个实施例中,语音识别软件将确 定仅有音频的与会者的身份。 现在参考图2,过程200描述可以如何将具有显示当前发言者的个人识别信息的 能力的视频会议系统配置用于多地点、多个与会者的会议。应当注意,图2描述在许多会 议地点中的仅仅一个地点处的设置过程,并且所描述的步骤可以在视频会议之前在许多或 全部会议地点处发生。当与会者在会议开始之前到达会议地点时,可以给主持人(145)分 派将每个与会者输入到视频会议系统中的任务。在可替换实施例中,单个主持人从单个地 点管理所有会议地点,并且由与会者自己执行视频会议设置。 一个或多个地点处的主持人 (145)也可以是视频会议的与会者。 从块210开始, 一旦与会者就座,主持人(145)就可以将摄像机调焦(zoom)到与 会者并且创建和与会者及他的位置相关联的摄像机预置内容(preset)。同样在块210处, 摄像机还可以捕获与会者的随后的人脸识别所需的视觉信息。 本文档来自技高网...

【技术保护点】
一种确定并显示关于音频/视频会议的当前发言的与会者的个人信息的方法,包括:检测来自当前发言的与会者的音频输入;识别该当前发言的与会者;以及提供与所确定的身份相关联的个人信息,用于在该音频/视频会议的一个或多个终端处显示。

【技术特征摘要】
US 2008-10-2 12/244,582一种确定并显示关于音频/视频会议的当前发言的与会者的个人信息的方法,包括检测来自当前发言的与会者的音频输入;识别该当前发言的与会者;以及提供与所确定的身份相关联的个人信息,用于在该音频/视频会议的一个或多个终端处显示。2. 如权利要求1所述的方法,还包括 将摄像机定位朝向该当前发言的与会者。3. 如权利要求2所述的方法,其中识别该当前发言的与会者的步骤包括使用人脸识别 软件。4. 如权利要求2所述的方法,其中将摄像机定位朝向所检测的音频输入的步骤包括使 用定向传声器来将摄像机定位朝向该当前发言的与会者。5. 如权利要求1所述的方法,其中识别该当前发言的与会者的步骤包括使用语音识别 软件。6. 如权利要求1所述的方法,其中识别该当前发言的与会者的步骤包括手动校正不正 确的自动确定的身份并且将该手动校正后的信息用于未来的发言的与会者的身份的自动 确定,其中改善自动确定以用于随后的发言的与会者的识别。7. 如权利要求1所述的方法,其中显示与所确定的身份相关联的个人信息的步骤包括 显示选自由正式姓名、头衔和位置组成的组中的信息。8. —种在视频会议呼叫中识别与会者的方法,包括存储对与会者唯一的一个或多个标识数据项,以便在以后用于将与会者自动识别为当 前发言的与会者;获得该与会者的个人信息,其中该个人信息用来向其他与会者表示当前发言的与会者 的身份;使用所存储的该一个或多个标识数据项中的一个或多个来识别当前发言的与会者;以及在该视频会议呼叫期间,每当识别出当前发言的与会者时,就提供相应的所获得的该 与会者的个人信息。9. 如权利要求8所述的方法,其中对与会者唯一的所述一个或多个数据项选自由先前 存储的会议室内的与会者的物理位置、用于语音识别的语音样本和用于人脸识别的图像组 成的组中。10. 如权利要求8所述的方法,其中使用所存储的该一个或多个数据项中的一个或多 个的步骤包括独立地处理来自于所存储的该一个或多个标识数据项中的多于一个数据项, 并且在提供该与会者的个人信息之前,验证该多于一个数据项中的每一个的处理一致地识 别出当前发言的与会者。11. 如权利要求8所述的方法,其中获得该与会者的个人信息的步骤包括使用语音到 文本能力,凭借该语音到文本能力,一个或多个与会者说出他们需要的个人信息。12. 如权利要求8所述的方法,其中获得该与会者的个人信息的步骤包括将从外部源 检索的预定义的个人信息与该与会者相关联。13. 如权利要求8所述的方法,其中存储对与会者唯一的一个或多个数据项的步骤包 括使用智能卡阅读器来识别该与会者的位置和个人信息。14. 如权利要求12所述的方法,其中该外部源是智能卡阅读器。...

【专利技术属性】
技术研发人员:M雷曼
申请(专利权)人:宝利通公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利