【技术实现步骤摘要】
用于视频电话会议的虚拟声音定位
[0001]对相关申请的交叉引用本申请根据35 USC
ꢀ§ꢀ
119(e)而要求提交于2021年8月4日的美国临时专利申请No. 63/203,941的优先权和权益,该临时专利申请通过引用而以其整体并入于本文中。
[0002]目前的实现方式一般涉及电话会议,并且具体地涉及用于视频电话会议的虚拟声音定位。
技术介绍
[0003]视频电话会议(也被称为“视频会议”)是允许两个或更多个人从不同地点接近实时地看到彼此且听到彼此的通信技术。视频会议能够通过从多个参与者传送和接收视频信号和音频信号的设备或终端的网络来建立。例如,每个终端一般至少包括用以捕获用户的视频的照相机、用以从用户捕获音频的麦克风、用以回放其他参与者的所捕获的视频的显示部件以及用以回放从其他参与者捕获的音频的音频输出部件。
[0004]视频会议技术上的进步已导致具有越来越多数量的参与者的更大规模的视频会议。然而,在许多视频会议中,在任何给定时间,可能仅一个(或几个)参与者(也被称为“说话者”)正在说话 ...
【技术保护点】
【技术特征摘要】
1.一种处理音频信号的方法,包括:接收与包括多个参与者的视频会议关联的第一音频信号;检测与所述第一音频信号关联的第一说话者,所述第一说话者是所述视频会议中的所述多个参与者中的一个参与者;将所述第一说话者映射到第一空间方向;基于与所述第一空间方向关联的一个或多个传递函数而使所述第一音频信号变换;以及将经变换的第一音频信号传送到音频输出设备。2.根据权利要求1所述的方法,其中所述第一说话者到所述第一空间方向的映射包括:确定所述第一说话者在与所述视频会议关联的显示器上的位置,所述第一说话者的所述位置与所述第一空间方向关联。3.根据权利要求2所述的方法,其中所述第一说话者的所述位置的确定包括:接收指示所述多个参与者中的每个参与者在所述显示器上的相对位置的位置信息。4.根据权利要求2所述的方法,其中所述第一说话者的所述位置的确定包括:接收与所述视频会议关联的视频帧,所述第一说话者的所述位置至少部分地基于所接收的视频帧而确定。5. 根据权利要求1所述的方法,其中与所述第一音频信号关联的所述第一说话者的检测包括:接收与所述视频会议关联的视频帧;以及对所接收的视频帧执行识别与所述第一音频信号关联的所述第一说话者的图像处理操作。6.根据权利要求1所述的方法,其中所述一个或多个传递函数包括使得由所述音频输出设备发射的声波被感知为源自所述第一空间方向的头部相关传递函数(HRTF)。7.根据权利要求1所述的方法,其中所述一个或多个传递函数包括与所述音频输出设备的左音频通道关联的第一传递函数和与所述音频输出设备的右音频通道关联的第二传递函数,所述第一传递函数不同于所述第二传递函数。8. 根据权利要求1所述的方法,进一步包括:接收与所述第一音频信号关联的反馈;以及基于所接收的反馈而调整所述一个或多个传递函数。9.根据权利要求1所述的方法,进一步包括:接收与所述视频会议关联的第二音频信号;检测与所述第二音频信号关联的第二说话者,所述第二说话者是所述多个参与者中的与所述第一说话者不同的一个参与者;将所述第二说话者映射到与所述第一空间方向不同的第二空间方向;基于与所述第二空间方向关联的一个或多个传递函数而使所述第二音频信号变换;以及将经变换的第二音频信号传送到所述音频输出设备。10. 一种视频会议系统,包括:处理系统;以及
存储器,其存储指令,所述指令在由所述处理系统执行时,使得所述视频会议系统:接收与包括多个参与者的视频会议关联的第一音频信号;检测与所述第一音频信号关联的第一说话者,所述第一说话者是所述视频会议中的所述多个参与者中的一个参与者;将所述第一说话者映射到第一空间方向;基于与所述第一空间方向关联的一个或多个传递函数而使所述第一音频信号变换;以及将经变换的第一音频信号传送到音频输出设备。11.根据权利要求10所述的视频会议系统,其中所述第一说话者到所述第一空间方向的映射包括:确...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。