定位方法、终端设备及会议系统技术方案

技术编号：25486871 阅读：28 留言：0更新日期：2020-09-01 23:06

本申请适用于数据处理技术领域，提供了一种定位方法、终端设备及会议系统，定位方法包括：获取音频信号；根据音频信号，获取发出该音频信号的用户的目标脸部图像；获取用户当前所在场景的图像；从用户当前所在场景的图像中查找目标脸部图像，获取目标脸部图像在用户当前所在场景的图像中的位置；根据该位置获取用户在当前所在场景中的位置。本申请提供的定位方法融合了音频识别和人脸识别技术，根据获取到的音频信号以及图像信号进行处理分析，自动定位到用户，相较于人为定位的方式，在获取到音频信号以及图像信号之后，就能够立即识别得到用户，过程比较简单，而且具有较快的识别速度，实现目标的快速定位识别，提升用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
定位方法、终端设备及会议系统
本申请属于数据处理
，尤其涉及一种定位方法、终端设备及会议系统。
技术介绍
在开会时，尤其是进行视频会议时，需要将摄像头对准发言人，以采集发言人的图像信息。但是，目前通常采用人为操作的方式，操作人员需要先获知发言人的位置，然后通过摄像头的变焦和移动功能将镜头反复调整，最终移动到发言人上，该操作过程即麻烦又耗时，无法实现快速定位，用户体验不佳。申请内容有鉴于此，本申请实施方式提供了一种定位方法、终端设备及会议系统，以解决现有的定位方式定位缓慢的问题。本申请实施方式第一方面提供了一种定位方法，所述定位方法包括：获取音频信号；根据所述音频信号，获取发出所述音频信号的用户的目标脸部图像；获取所述用户当前所在场景的图像；从所述用户当前所在场景的图像中查找所述目标脸部图像，获取所述目标脸部图像在所述用户当前所在场景的图像中的位置；根据所述目标脸部图像在所述用户当前所在场景的图像中的位置，获取所述用户在当前所在场景中的位置。本申请实...

【技术保护点】
1.一种定位方法，其特征在于，所述定位方法包括：/n获取音频信号；/n根据所述音频信号，获取发出所述音频信号的用户的目标脸部图像；/n获取所述用户当前所在场景的图像；/n从所述用户当前所在场景的图像中查找所述目标脸部图像，获取所述目标脸部图像在所述用户当前所在场景的图像中的位置；/n根据所述目标脸部图像在所述用户当前所在场景的图像中的位置，获取所述用户在当前所在场景中的位置。/n

【技术特征摘要】
1.一种定位方法，其特征在于，所述定位方法包括：
获取音频信号；
根据所述音频信号，获取发出所述音频信号的用户的目标脸部图像；
获取所述用户当前所在场景的图像；
从所述用户当前所在场景的图像中查找所述目标脸部图像，获取所述目标脸部图像在所述用户当前所在场景的图像中的位置；
根据所述目标脸部图像在所述用户当前所在场景的图像中的位置，获取所述用户在当前所在场景中的位置。

2.根据权利要求1所述的定位方法，其特征在于，所述根据所述音频信号，获取发出所述音频信号的用户的目标脸部图像，包括：
根据所述音频信号，获取发出所述音频信号的用户的声纹；
根据发出所述音频信号的用户的声纹，获取发出所述音频信号的用户的目标脸部图像。

3.根据权利要求2所述的定位方法，其特征在于，在获取所述音频信号之前，所述定位方法还包括：
建立不同声纹与不同脸部图像的对应关系；
相应的，所述根据发出所述音频信号的用户的声纹，获取发出所述音频信号的用户的目标脸部图像，包括：
从所述不同声纹与不同脸部图像的对应关系中，获取发出所述音频信号的用户的声纹对应的脸部图像，该脸部图像为发出所述音频信号的用户的目标脸部图像。

4.根据权利要求3所述的定位方法，其特征在于，所述定位方法还包括：
若从所述不同声纹与不同脸部图像的对应关系中，未获取到发出所述音频信号的用户的声纹对应的脸部图像，则返回执行所述获取音频信号。

5.根据权利要求1所述的定位方法，其特征在于，所述从所述用户当前所在场景的图像中查找所述目标脸部图像，获取所述目标脸部图像在所述用户当前所在场景的图像中的位置，包括：
获取所述用户当前所在场...

【专利技术属性】
技术研发人员：林瑞成，霍澄平，
申请(专利权)人：深圳市鸿合创新信息技术有限责任公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人