一种视频会议的声音处理方法技术

技术编号:7839884 阅读:219 留言:0更新日期:2012-10-12 07:33
本发明专利技术提出了一种视频会议的声音处理方法,其特征在于,包括步骤:A、确定视频会议的视频显示终端中各个视频显示窗口的位置;B、根据各个视频显示窗口的不同位置,分别为各个视频显示窗口配置对应其各自位置的声场;C、播放各个视频显示窗口对应的音频数据时,根据各个视频显示窗口对应的所配置的声场播放所述音频数据。本发明专利技术通过播放出的声音对应的方位确定出该方位对应的视频窗口,从而确定出发言的会议参与者。

【技术实现步骤摘要】

本专利技术涉及视频会议
,特别是指。
技术介绍
对于目前的视频会议(包括如QQ、MSN等即时通讯的多人视频对话)系统终端,通常包括由大屏幕显示器、投影仪、电视墙等构成的显示终端,设置在显示终端两侧的扬声器,麦克风,以及用于传输音视频的主机。其中主机可由计算机实现。当用户与多个会议参与者进行视频会议时,主机从网络接收各个会议参与者的音视频数据,显示终端显示各个会议参与者的各个的视频显示窗口播放相应的视频,并通过扬声器播放所接收的音频。目前,用户多是通过声音特性(如声音粗细、高低等),或通过观察各个视频窗口参会者的口型状态,判断出所播放的音频对应哪个视频显示窗口,即确定是谁在发言,因此并没有现场会议的现场感。另外,当出现多个参与者同时发言的情景时,发生扬声器同时播放出多个参与者的音频,还会造成声音的混乱,不仅影响通话质量,还使得用户更难以辨别出声音对应哪个视频显示窗口,即更难确定是谁在发言。
技术实现思路
有鉴于此,本专利技术的主要目的在于,提供一种自动配置视频声场的方法,实现通过播放出的声音对应的方位确定出该方位对应的视频窗口,从而确定出发言的会议参与者。本专利技术动配置视频声场的方法包括步骤A、确定视频会议的视频显示终端中各个视频显示窗口的位置;B、根据各个视频显示窗口的不同位置,分别为各个视频显示窗口配置对应其各自位置的声场;C、播放各个视频显示窗口对应的音频数据时,根据各个视频显示窗口对应的所配置的声场播放所述音频数据。由上,通过配置不同位置的视频显示窗口的声场,实现通过播放出的声音对应的方位确定出该方位对应的视频窗口,从而确定出发言的会议参与者。可选的,确定当前用户在视频显示终端上投影对应的位置;步骤B还包括将所述投影对应的位置作为声场的中心,来配置所述各个视频显示窗口对应的声场。由上,通过以当前用户投影位置为中心,实现确定出各视频显示窗口相对于当前用户的位置。从而依据位置配置声场。可选的,还包括视频显示终端至少两侧各有一扬声器,步骤B中一视频显示窗口的所述声场的配置包括通过配置扬声器之间的音量差、播放音频数据的时间差和/或相位差配置该视频显示窗口对应其位置的所述声场。由上,通过音量差、时间差和/或相位差的配置,实现模拟出不同位置的声源。可选的,配置的所述扬声器之间的音量差、播放音频数据的时间差和/或相位差随视频显示窗口距离声场的中心距离的增大而增大。由上,通过依据各视频显示窗口的距离进行配置,实现模拟出不同位置以及距离的声源。可选的,所述确定当前用户在视频显示终端上投影对应位置的步骤包括采集包括当前用户面部区域的视频显示终端正前方的图像,确定出双眼中心;将所述双眼中心在视频显示终端投影的位置为当前用户在视频显示终端上投影 对应的位置。由上,通过确定当前用户的投影位置,以便确定出各视频显示终端相对于当前用户所在的位置。可选的,还包括确定用户所关注的视频显示窗口,增大该视频显示窗口对应的音频数据的音量。由上,实现自动提闻用户关注的视频显不窗口的首量。可选的,所述确定用户所关注的视频显示窗口的步骤包括采集当前用户面部区域图像,确定出双眼瞳孔位置;以穿过该中心位置、垂直所述面部区域图像的视频显示窗口为用户所关注的视频显示窗口。由上,实现确定用户双眼所注视的视频显示窗口。可选的,所述各个视频显示窗口的位置可调整。附图说明图I为本专利技术自动控制视频音量的方法的流程图;图2为本专利技术第一实施例中多个视频显示窗口的排列示意图;图3为本专利技术第二实施例中多个视频显示窗口的排列示意图;图4为本专利技术第三实施例中多个视频显示窗口的排列示意图。具体实施例方式下面结合附图对本专利技术所述视频会议的声音处理方法进行详细描述。如图I所示,本专利技术自动控制视频音量的方法包括步骤步骤SlO :确定显示终端中各视频显示窗口位于屏幕的所在位置。如图2所示,在本专利技术第一实施例中,视频显示终端包括左、中、右三个视频显示窗口。视频显示终端屏幕的四个端点坐标分别为(0,0)、《,0)、(&¥)和(0八)。分别取每个视频显示窗口所在横坐标的中点An,其中,n为视频显示窗口的序号。则,视频显示窗口相对于视频显示终端的位置通过表达式An/X表示。不难理解,也可依据参与视频会议的人数增加视频显示窗口的数量,例如图3所示在本专利技术第二实施例中,视频显示终端由五个视频显示窗口组成。另外,在如图4所示的第三实施例中,视频显示终端被分为九个视频显示窗口。则依次将参与视频会议的人对应在上述九个视频显示窗口显示。每个视频显示窗口的坐标表示为(An, Bn),其中,A表示该视频显示窗口所在横坐标的中点,B表示该视频显示窗口所在纵坐标的中点,n为视频显示窗口的序号。其中,各视频显示窗口的纵向排列位置依据表达式Bn/Y表示。当前用户可任意调换各视频显示窗口的位置,设置完毕后,视频显示终端存储现有各视频显示窗口的位置关系。上述为多屏显示的现有技术,故不再赘述。步骤S20 :采集当前用户相对于视频显示终端所在的位置。通过图像定位采集当前用户所在位置,具体来说,视频显示终端上设置图像采集装置,图像采集装置,如摄像头采集当前用户面对视频显示终端所在的位置,并将该位置进行投影,投影至视频显示终端的显示平面。其中,图像采集装置采集当前用户所在位置包含有当前用户面部区域的视频显示终端正前方的图像,确定出图像中当前用户双眼中心,将所述双眼中心在视频显示终端投影的位置为当前用户在视频显示终端上投影对应的位置。该位置用字母C表示,则当前用户投影位置相对于视频显示终端的位置通过表达式C/X表 示,确定出其位于视频显示终端显示平面上的坐标。另外,采集当前用户所在位置还可通过红外感应装置,红外感应装置收发红外射线,当前用户阻断红外射线时,红外感应装置便可获取其所在位置。另外,采集当前用户所在位置的方法还包括超声波定位、蓝牙定位或超宽带定位坐寸o步骤S30 :确定当前用户相对于视频显示窗口所在的位置。由步骤SlO和步骤S20中的坐标An和C或表达式An/X和C/X,即可判断出各个视频显示窗口相对于当前用户投影的位置。步骤S40 :视频显示终端依据各视频显示窗口相对于参考位置配置不同视频显示窗口的不同声场。依据“双耳效应”理论,人耳对声场方位的判定能力是根据双耳间隔差(约17cm)弓丨起的以下三个物理因素产生的声音到达双耳间的时间差、声音到达双耳间的强度差以及声音到达双耳间的相位差。其中,时间差反映声音到达双耳先后造成的相对时间差异;强度差则反映声音在空气中传播由于双耳间隔所造成的衰减差异;相位差依据时间差产生,由于声音以波的形式传播过程中。相位差就是波形由一个位置传到另一个位置的时间之差,当左右扬声器具有一定的相位差,声音便有了宽度,有了立体感。当由两扬声器发出的不同声道音频相位差达到180°时,则当前用户可感觉到声音从身后发出。声音的函数表达式为y=Asin ( wX+),其中,A表示振幅,即声音强度、coX+4>表示相位,是初相。表达式中(0=2 /T,T为周期,周期为频率f的倒数。由此,通过改变上述三个物理因素便可模拟出声场的不同位置。若左右两扬声器的音频信号同步,即不存在任何时间差别的情况下,声场定位在左右两扬声器连线的中点上。若左右两扬声器间的音频信号存在时间差,即一只扬声器相本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种视频会议的声音处理方法,其特征在于,包括步骤 A、确定视频会议的视频显示终端中各个视频显示窗口的位置; B、根据各个视频显示窗口的不同位置,分别为各个视频显示窗口配置对应其各自位置的声场; C、播放各个视频显示窗口对应的音频数据时,根据各个视频显示窗口对应的所配置的声场播放所述音频数据。2.根据权利要求I所述的方法,其特征在于,还包括 确定当前用户在视频显示终端上投影对应的位置; 步骤B还包括将所述投影对应的位置作为声场的中心,来配置所述各个视频显示窗口对应的声场。3.根据权利要求I或2所述的方法,其特征在于,还包括 视频显示终端至少两侧各有一扬声器,步骤B中一视频显示窗口的所述声场的配置包括 通过配置扬声器之间的音量差、播放音频数据的时间差和/或相位差配置该视频显示窗口对应其位置的所述声场。4.根据权利要求3所述的方法,其特征在于,配置...

【专利技术属性】
技术研发人员:王瑞
申请(专利权)人:北京中自科技产业孵化器有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1