一种在多人语音中用于静音处理的方法与设备技术

技术编号:27113301 阅读:42 留言:0更新日期:2021-01-25 19:11
本申请的目的是提供一种在多人语音中用于静音处理的方法与设备,该方法包括:在多人语音的通话过程中,获取第一用户的当前脸部位置信息;根据所述当前脸部位置信息,确定是否需要对所述用户设备的后续输入语音信息进行静音处理;若是,对所述后续输入语音信息进行静音处理;否则,不对所述后续输入语音信息进行静音处理。本申请相比于用户手动静音的方式,无需用户手动执行任何操作,能够为用户提供极大的便利,可以增强用户体验,提高多人语音的通话质量,减少多人语音通话中的干扰。减少多人语音通话中的干扰。减少多人语音通话中的干扰。

【技术实现步骤摘要】
一种在多人语音中用于静音处理的方法与设备


[0001]本申请涉及通信领域,尤其涉及一种用于在多人语音中用于静音处理的技术。

技术介绍

[0002]随着时代的发展,多人语音通话已经得到了广泛的应用,如多人语音通话已经被广泛应用于远程会议、游戏团队在线指挥、在线唱歌、直播等各个领域。目前,在多人语音通话过程中,用户在存在静音需求时,可以通过手动点击预定按钮来实现静音目的。

技术实现思路

[0003]本申请的一个目的是提供一种在多人语音中用于静音处理的方法与设备。
[0004]根据本申请的一个方面,提供了一种在多人语音中用于静音处理的方法,该方法包括:
[0005]在多人语音的通话过程中,获取第一用户的当前脸部位置信息;
[0006]根据所述当前脸部位置信息,确定是否需要对所述用户设备的后续输入语音信息进行静音处理;若是,对所述后续输入语音信息进行静音处理;否则,不对所述后续输入语音信息进行静音处理。
[0007]根据本申请的一个方面,提供了一种在多人语音中用于静音处理的用户设备,该设备包括:
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种在多人语音中用于静音处理的方法,应用于用户设备,其中,所述方法包括:在多人语音的通话过程中,获取第一用户的当前脸部位置信息;根据所述当前脸部位置信息,确定是否需要对所述用户设备的后续输入语音信息进行静音处理;若是,对所述后续输入语音信息进行静音处理;否则,不对所述后续输入语音信息进行静音处理。2.根据权利要求1所述的方法,其中,所述当前脸部位置信息包括当前脸部朝向信息和/或当前脸部方向信息;其中,所述在多人语音的通话过程中,获取第一用户的当前脸部位置信息,包括:在多人语音的通话过程中,根据所述用户设备中的摄像装置所采集的第一图像信息确定第一用户的当前脸部朝向信息和/或当前脸部方向信息。3.根据权利要求2所述的方法,其中,所述当前脸部位置信息还包括当前脸部距离信息,所述摄像装置为深度摄像装置;其中,所述在多人语音的通话过程中,根据所述用户设备中的摄像装置所采集的第一图像信息确定第一用户的当前脸部朝向信息和/或当前脸部方向信息,包括:在多人语音的通话过程中,根据所述深度摄像装置所采集的第一图像信息确定第一用户的当前脸部朝向信息和/或当前脸部方向信息和/或当前脸部距离信息。4.根据权利要求2所述的方法,其中,所述在多人语音的通话过程中,根据所述用户设备中的摄像装置所采集的第一图像信息确定第一用户的当前脸部朝向信息和/或当前脸部方向信息,包括:在多人语音的通话过程中,从所述用户设备中的摄像装置所采集的第一图像信息中识别人脸对象;根据识别结果,确定第一用户的当前脸部朝向信息和/或当前脸部方向信息。5.根据权利要求4所述的方法,其中,所述人脸对象为所述第一用户的人脸对象;其中,所述在多人语音的通话过程中,从所述用户设备中的摄像装置所采集的第一图像信息中识别人脸对象,包括:在多人语音的通话过程中,根据预先获取的所述第一用户的人脸特征信息,从摄像装置所采集的第一图像信息中识别所述第一用户的人脸对象。6.根据权利要求2所述的方法,其中,所述当前脸部位置信息包括当前脸部距离信息和/或当前脸部方向信息;其中,所述在多人语音的通话过程中,获取第一用户的当前脸部位置信息,包括:在多人语音的通话过程中,通过对所述用户设备对应的输入语音信息进行声源定位,确定第一用户的当前脸部距离信息和/或当前脸部方向信息。7.根据权利要求6所述的方法,其中,所述在多人语音的通话过程中,通过对所述用户设备对应的输入语音信息进行声源定位,确定第一用户的当前脸部距离信息和/或当前脸部方向信息,包括:在多人语音的通话过程中,识别所述用户设备对应的输入语音信息中包含的人声信息;通过对识别得到的人声信息进行声源定位,确定第一用户的当前脸部距离信息和/或当前脸部方向信息。
8.根据权利要求7所述的方法,其中,所述人声信息为所述第一用户的声音信息;其中,所述在多人语音的通话过程中,识别所述用户设备对应的输入语音信息中包含的人声信息,包括:在多人语音的通话过程中,根据预先获取的所述第一用户的声纹特征信息,从所述用户设备对应的输入语音信息中识别得到所述第一用户的声音信息;其中,所述通过对识别得到的人声信息进行声源定位,确定第一用户的当前脸部距离信息和/或当前脸部方向信息,包括:通过对所述第一用户的声音信息进行声源定位,确定第一用户的当前脸部距离信息和/或当前脸部方向信息。9.根据权利要求1所述的方法,其中,所述根据所述当前脸部位置信息,确定是否需要对所述用户设备的后续输入语音信息进行静音处理,包括:根据所述当前脸部位置信息,并结合历史脸部位置信息,确定所述当前脸部位置信息的保持时长信息;若所述保持时长信息大于或等于预定的时长阈值,根据所述当前脸部位置信息,确定是否需要对所述用户设备的后续输入语音信息进行静音处理。10.根据权利要求1或9所...

【专利技术属性】
技术研发人员:程翰
申请(专利权)人:上海连尚网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利