定位方法、终端设备及会议系统技术方案

技术编号:25486871 阅读:28 留言:0更新日期:2020-09-01 23:06
本申请适用于数据处理技术领域,提供了一种定位方法、终端设备及会议系统,定位方法包括:获取音频信号;根据音频信号,获取发出该音频信号的用户的目标脸部图像;获取用户当前所在场景的图像;从用户当前所在场景的图像中查找目标脸部图像,获取目标脸部图像在用户当前所在场景的图像中的位置;根据该位置获取用户在当前所在场景中的位置。本申请提供的定位方法融合了音频识别和人脸识别技术,根据获取到的音频信号以及图像信号进行处理分析,自动定位到用户,相较于人为定位的方式,在获取到音频信号以及图像信号之后,就能够立即识别得到用户,过程比较简单,而且具有较快的识别速度,实现目标的快速定位识别,提升用户体验。

【技术实现步骤摘要】
定位方法、终端设备及会议系统
本申请属于数据处理
,尤其涉及一种定位方法、终端设备及会议系统。
技术介绍
在开会时,尤其是进行视频会议时,需要将摄像头对准发言人,以采集发言人的图像信息。但是,目前通常采用人为操作的方式,操作人员需要先获知发言人的位置,然后通过摄像头的变焦和移动功能将镜头反复调整,最终移动到发言人上,该操作过程即麻烦又耗时,无法实现快速定位,用户体验不佳。申请内容有鉴于此,本申请实施方式提供了一种定位方法、终端设备及会议系统,以解决现有的定位方式定位缓慢的问题。本申请实施方式第一方面提供了一种定位方法,所述定位方法包括:获取音频信号;根据所述音频信号,获取发出所述音频信号的用户的目标脸部图像;获取所述用户当前所在场景的图像;从所述用户当前所在场景的图像中查找所述目标脸部图像,获取所述目标脸部图像在所述用户当前所在场景的图像中的位置;根据所述目标脸部图像在所述用户当前所在场景的图像中的位置,获取所述用户在当前所在场景中的位置。本申请实施方式第二方面提供了本文档来自技高网...

【技术保护点】
1.一种定位方法,其特征在于,所述定位方法包括:/n获取音频信号;/n根据所述音频信号,获取发出所述音频信号的用户的目标脸部图像;/n获取所述用户当前所在场景的图像;/n从所述用户当前所在场景的图像中查找所述目标脸部图像,获取所述目标脸部图像在所述用户当前所在场景的图像中的位置;/n根据所述目标脸部图像在所述用户当前所在场景的图像中的位置,获取所述用户在当前所在场景中的位置。/n

【技术特征摘要】
1.一种定位方法,其特征在于,所述定位方法包括:
获取音频信号;
根据所述音频信号,获取发出所述音频信号的用户的目标脸部图像;
获取所述用户当前所在场景的图像;
从所述用户当前所在场景的图像中查找所述目标脸部图像,获取所述目标脸部图像在所述用户当前所在场景的图像中的位置;
根据所述目标脸部图像在所述用户当前所在场景的图像中的位置,获取所述用户在当前所在场景中的位置。


2.根据权利要求1所述的定位方法,其特征在于,所述根据所述音频信号,获取发出所述音频信号的用户的目标脸部图像,包括:
根据所述音频信号,获取发出所述音频信号的用户的声纹;
根据发出所述音频信号的用户的声纹,获取发出所述音频信号的用户的目标脸部图像。


3.根据权利要求2所述的定位方法,其特征在于,在获取所述音频信号之前,所述定位方法还包括:
建立不同声纹与不同脸部图像的对应关系;
相应的,所述根据发出所述音频信号的用户的声纹,获取发出所述音频信号的用户的目标脸部图像,包括:
从所述不同声纹与不同脸部图像的对应关系中,获取发出所述音频信号的用户的声纹对应的脸部图像,该脸部图像为发出所述音频信号的用户的目标脸部图像。


4.根据权利要求3所述的定位方法,其特征在于,所述定位方法还包括:
若从所述不同声纹与不同脸部图像的对应关系中,未获取到发出所述音频信号的用户的声纹对应的脸部图像,则返回执行所述获取音频信号。


5.根据权利要求1所述的定位方法,其特征在于,所述从所述用户当前所在场景的图像中查找所述目标脸部图像,获取所述目标脸部图像在所述用户当前所在场景的图像中的位置,包括:
获取所述用户当前所在场...

【专利技术属性】
技术研发人员:林瑞成霍澄平
申请(专利权)人:深圳市鸿合创新信息技术有限责任公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1