视频会议装置与视频会议管理方法制造方法及图纸

技术编号:19649430 阅读:26 留言:0更新日期:2018-12-05 21:20
本发明专利技术提供一种视频会议装置与对应的视频会议管理方法。所述方法包括接收会议空间内所发出的声音;根据所接收到的声音来判断所述声音的第一位置;获取会议空间的全景影像;识别所述全景影像中的多个与会者的脸部影像,并且识别所述多个脸部影像于所述全景影像中的第二位置;根据所述第一位置、所述多个第二位置与所述多个脸部影像来判定所述多个与会者中的发言者;设定所述全景影像显示于视频会议影像的第一区域,放大所述全景影像中的所判定的所述发言者的影像,并且设定所放大的该发言者的所述影像显示于所述视频会议影像的第二区域。

【技术实现步骤摘要】
视频会议装置与视频会议管理方法
本专利技术涉及一种视频装置,且特别涉及一种适用于视频会议的视频会议装置与视频会议管理方法。
技术介绍
传统视频会议系统利用3个以上的摄影机来拍摄参与会议的人,同时使用麦克风阵列来进行发言者的定位,并且将所定位的发言者放大于视频会议影像中。然而,传统作法仅执行声音定位来判断音源位置,并且认为该音源位置即是发言者的位置,进而将该位置的影像放大于视频会议影像中。因此,上述传统方法会因为环境噪音的影像而导致准确度不足,无法精准地判断发言者的位置。
技术实现思路
本专利技术提供一种视频会议装置与视频会议管理方法,可通过声音定位与影像识别来准确且自动地检测发言者,以将发言者的影像放大且显示于视频会议影像中。本专利技术的一实施例提供一种视频会议装置。所述装置包括麦克风阵列、声音定位单元、影像获取装置、影像识别单元与视频会议管理单元。所述麦克风阵列包括多个麦克风,并且用以接收会议空间内所发出的声音。所述声音定位单元耦接至所述麦克风阵列,并且用以根据所接收到的所述声音来判断所述声音的第一位置。所述影像获取装置用以获取所述会议空间的全景影像。所述影像识别单元耦接所述影像获取装置,用以识别所述全景影像中的至少一个与会者的脸部影像,并且判断所述至少一个脸部影像的第二位置。所述视频会议管理单元耦接所述声音定位单元与所述影像识别单元,并且用以根据所述第一位置、所述至少一个第二位置与所述至少一个脸部影像来判定所述至少一个与会者中的发言者。此外,所述视频会议管理单元设定所述全景影像显示于视频会议影像的第一区域,放大所述全景影像中的所判定的所述发言者的影像,并且设定所放大的所述发言者的所述影像显示于所述视频会议影像的第二区域。在上述的实施例中,所述视频会议管理单元对所述发言者所发出的所述声音进行语音转文字操作,以将所述发言者的所述声音转换为对应所述发言者的文字信息,其中所述视频会议管理单元存储对应该发言者的识别名称与所述文字信息至会议记录数据库。本专利技术的一实施例提供一种视频会议管理方法,适用于在会议空间所进行的视频会议,其中所述会议空间具有至少一个与会者。所述方法包括接收所述会议空间内所发出的声音;根据所接收到的所述声音来判断所述声音的第一位置;获取所述会议空间的全景影像;识别所述全景影像中的所述至少一个与会者的脸部影像,并且判断所述至少一个脸部影像的第二位置;根据所述第一位置、所述至少一个第二位置与所述至少一个脸部影像来判定所述至少一个与会者中的发言者;以及设定所述全景影像显示于视频会议影像的第一区域,放大所述全景影像中的所判定的所述发言者的影像,并且设定所放大的该发言者的所述影像显示于所述视频会议影像的第二区域。在上述的实施例中,所述视频会议管理单元对所述发言者所发出的所述声音进行语音转文字操作,以将所述发言者的所述声音转换为对应所述发言者的文字信息,其中所述视频会议管理单元存储对应该发言者的识别名称与所述文字信息至会议记录数据库。基于上述,本专利技术所提供的视频会议装置与视频会议管理方法,能够利用声音定位与影像识别,来精确地判别举行视频会议的会议空间中的发言者,将发言者的影像放大且显示于具有所述会议空间中的所有与会者的全景影像的视频会议影像中。此外,更能够对发言者的言论进行语音转文字操作,存储对应所述发言者的识别名称与所述言论的文字信息,以建立所述视频会议的会议记录。如此一来,本专利技术所提供的视频会议装置与视频会议管理方法能够让所有与会者直觉地且专注于发言者上,以更有效率地进行视频会议,并且所述装置与方法还能够实时地建立会议记录,进而增进了视频会议的整体工作效率。为让本专利技术的上述特征和优点能更明显易懂,下文特举实施例,并配合附图作详细说明如下。附图说明图1A是依照本专利技术的一实施例所示的视频会议的示意图;图1B是依照本专利技术的一实施例所示的对应图1A中的视频会议的全景影像的示意图;图2是依照本专利技术的一实施例所示的视频会议装置的方框图;图3是依照本专利技术的一实施例所示的视频会议方法的流程图;图4是依照本专利技术的一实施例所示的视频会议方法的步骤S309的流程图;图5A是依照本专利技术的一实施例所示的全景影像的示意图;图5B是依照本专利技术的一实施例所示的特征识别区域的示意图;图5C是依照本专利技术的一实施例所示的视频会议影像的示意图。具体实施方式图1A是依照本专利技术的一实施例所示的视频会议的示意图。图1B是依照本专利技术的一实施例所示的对应图1A中的视频会议的全景影像的示意图。请同时参照图1A、图1B,假设在会议空间1(如,会议室或演讲厅等空间)中,有四名与会者2、3、4、5正举行视频会议(或其他会利用到视频的会议、视频教学等类型的活动),并且会议空间1中配置有视频会议装置10。本实施例所提供的视频会议装置10会获取周遭的影像,来获得全景影像11(如,视频会议装置10会经由360度的全景摄影来获得全景影像)。如图1B所示,所述全景影像11会包含所有的与会者2、3、4、5,并且所述全景影像11也会包含所述与会者2、3、4、5周围的会议空间的影像。在本实施例中,视频会议装置10会判断在所有与会者中,谁是当前说话的发言者,并且根据此判断结果来产生(输出)视频会议影像。举例来说,当与会者2说话时(即,与会者2为发言者),视频会议装置10会接收与会者2所发出的声音21(亦称,言论21),根据所接收到的声音21来进行声音定位,并且根据对应与会者2的脸部影像的变化以及所获得的声音定位结果来判定与会者2为发出上述声音(言论)的发言者。以下会先通过图2来详细说明本专利技术所提供的视频会议装置。图2是依照本专利技术的一实施例所示的视频会议装置的方框图。请参照图2,在本实施例中,视频会议装置10包括视频会议管理单元110、麦克风阵列120、声音定位单元121、影像获取装置130、影像识别单元131、存储单元140以及连接接口单元150。声音定位单元121耦接至麦克风阵列120。影像识别单元131耦接至影像获取装置130。所述视频会议管理单元110耦接至声音定位单元121、影像识别单元131、存储单元140与连接接口单元150。在本实施例中,所述视频会议管理单元110为具备运算能力的硬件(例如芯片组、处理器等),用以控制视频会议装置10的其他元件的功能以及管理视频会议装置10的整体运行。在本实施例中,视频会议管理单元110例如是一核心或多核心的中央处理单元(CentralProcessingUnit,CPU)、图像处理单元(GraphicProcessingUnit,GPU)、微处理器(micro-processor)或是其他可程序化的处理单元(Microprocessor)、数字信号处理器(DigitalSignalProcessor,DSP)、可程序化控制器、专用集成电路(ApplicationSpecificIntegratedCircuits,ASIC)、可程序化逻辑装置(ProgrammableLogicDevice,PLD)或其他类似装置。所述存储单元140可经由视频会议管理单元110的指示来暂存数据,所述数据包括用以管理视频会议装置10的数据、从其他电子装置所接收的数据、用以传送至其他电子装置的数据或是其他类型的数据,本专利技术不限于此。除此之外,在本实施本文档来自技高网...

【技术保护点】
1.一种视频会议装置,其特征在于,包括:麦克风阵列,包括多个麦克风,用以接收会议空间内所发出的声音;声音定位单元,耦接至所述麦克风阵列,用以根据所接收到的所述声音来判断所述声音的第一位置;影像获取装置,用以获取所述会议空间的全景影像;影像识别单元,耦接所述影像获取装置,用以识别所述全景影像中的至少一个与会者的脸部影像,并且判断至少一个脸部影像的第二位置;以及视频会议管理单元,耦接所述声音定位单元与所述影像识别单元,用以根据所述第一位置、至少一个第二位置与所述至少一个脸部影像来判定所述至少一个与会者中的发言者,其中所述视频会议管理单元设定所述全景影像显示于视频会议影像的第一区域,放大所述全景影像中的所判定的所述发言者的影像,并且设定所放大的所述发言者的所述影像显示于所述视频会议影像的第二区域。

【技术特征摘要】
2017.05.26 TW 1061175511.一种视频会议装置,其特征在于,包括:麦克风阵列,包括多个麦克风,用以接收会议空间内所发出的声音;声音定位单元,耦接至所述麦克风阵列,用以根据所接收到的所述声音来判断所述声音的第一位置;影像获取装置,用以获取所述会议空间的全景影像;影像识别单元,耦接所述影像获取装置,用以识别所述全景影像中的至少一个与会者的脸部影像,并且判断至少一个脸部影像的第二位置;以及视频会议管理单元,耦接所述声音定位单元与所述影像识别单元,用以根据所述第一位置、至少一个第二位置与所述至少一个脸部影像来判定所述至少一个与会者中的发言者,其中所述视频会议管理单元设定所述全景影像显示于视频会议影像的第一区域,放大所述全景影像中的所判定的所述发言者的影像,并且设定所放大的所述发言者的所述影像显示于所述视频会议影像的第二区域。2.根据权利要求1所述的视频会议装置,其特征在于,所述视频会议管理单元对所述发言者所发出的所述声音进行语音转文字操作,以将所述发言者的所述声音转换为对应所述发言者的文字信息,其中所述视频会议管理单元存储对应所述发言者的识别名称与所述文字信息至会议记录数据库。3.根据权利要求1所述的视频会议装置,其特征在于,所述视频会议管理单元根据所述第一位置,设定所述全景影像中的目标区域,并且指示所述影像识别单元根据所述目标区域与所述至少一个第二位置识别在所述目标区域中的至少一个目标脸部影像,其中所述视频会议管理单元根据所述至少一个目标脸部影像的影像变化判定所述至少一个目标脸部影像所属的至少一个目标与会者中的所述发言者。4.根据权利要求3所述的视频会议装置,其特征在于,所述视频会议管理单元指示所述影像识别单元计算所述至少一个目标脸部影像的特征影像变化值,若至少一个特征影像变化值的最大特征影像变化值超过预定门限值,所述视频会议管理单元判定所述最大特征影像变化值所对应的与会者为所述至少一个目标与会者中的所述发言者。5.根据权利要求4所述的视频会议装置,其特征在于,所述视频会议管理单元指示所述影像识别单元根据所述至少一个第二位置中对应所述至少一个目标脸部影像的至少一个目标位置来设定所述至少一个目标脸部影像的特征识别区域,其中所述影像识别单元计算预定时间内,所述至少一个目标脸部影像的特征识别区域的像素变化值,并且将所计算出的对应所述至少一个目标脸部影像的像素变...

【专利技术属性】
技术研发人员:曾羽鸿陈柏森
申请(专利权)人:和硕联合科技股份有限公司
类型:发明
国别省市:中国台湾,71

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1