网络视频会议中防干扰方法、系统、设备及存储介质技术方案

技术编号：29798894 阅读：38 留言：0更新日期：2021-08-24 18:20

本公开提供一种网络视频会议中防干扰方法、系统、设备及存储介质，其中的方法包括：在各个用户参加网络视频会议的过程中，实时检测每个用户的视频会议终端是否输入了声音数据；若检测到某个用户的视频会议终端输入了声音数据，则调用该用户的视频会议终端的图像采集设备实时采集当前图像；判断图像中是否有人像；若有，则基于采集的预设时长的图像判断该用户是否在讲话；若该用户在讲话，则将该用户的视频会议终端输入的声音数据转化为数字信号后传输给其他用户的视频会议终端；若实时采集的当前图像中没有人像或者该用户未讲话，则将该用户的视频会议终端输入的声音数据屏蔽。本公开提供的技术方案可以解决网络视频会议过程中存在干扰音的问题。

全部详细技术资料下载

【技术实现步骤摘要】
网络视频会议中防干扰方法、系统、设备及存储介质
本公开涉及通信
，尤其涉及一种网络视频会议中防干扰方法、一种网络视频会议中防干扰系统、一种计算机设备以及一种计算机可读存储介质。
技术介绍
随着互联网技术的发展，远程办公越来越常见，而网络视频会议是远程办公必不可少的沟通交流方式之一。但是在开会过程中，经常由于与会者所处环境存在其他声音输入，如身边有人在说话或者发出其他噪音而打断主讲人的讲话，也影响其他与会者的听力理解质量，但是输入干扰音的与会者其本人往往并没有意识到自己这边的环境声音输入影响到了大家。目前，这类情况通常的解决方法是，如果某一与会者的环境声音输入影响到了其他与会者，需要其他与会者通知输入干扰音的与会者关闭话筒，但此前的干扰影响已经形成了，不可挽回；或者，在会议开始前，除了主讲人外，其他与会者都关闭话筒，但是当其他与会者想在会议中发表讲话时，还需要手动打开话筒，使用非常不便；或者，所有与会者都寻找一个较为安静的环境参加网络视频会议，但此环境不仅需要安静，同时还要满足一定的网络要求，条件较为苛刻...

【技术保护点】
1.一种网络视频会议中防干扰方法，其特征在于，包括：/n在各个用户参加网络视频会议的过程中，实时检测每个用户的视频会议终端是否输入了声音数据；/n若检测到某个用户的视频会议终端输入了声音数据，则调用该用户的视频会议终端的图像采集设备实时采集当前图像；/n判断实时采集的当前图像中是否有人像；/n若有，则基于采集的预设时长的图像判断该用户是否在讲话；/n若该用户在讲话，则将该用户的视频会议终端输入的声音数据转化为数字信号后传输给其他用户的视频会议终端；/n若实时采集的当前图像中没有人像或者该用户未讲话，则将该用户的视频会议终端输入的声音数据屏蔽。/n

【技术特征摘要】
1.一种网络视频会议中防干扰方法，其特征在于，包括：
在各个用户参加网络视频会议的过程中，实时检测每个用户的视频会议终端是否输入了声音数据；
若检测到某个用户的视频会议终端输入了声音数据，则调用该用户的视频会议终端的图像采集设备实时采集当前图像；
判断实时采集的当前图像中是否有人像；
若有，则基于采集的预设时长的图像判断该用户是否在讲话；
若该用户在讲话，则将该用户的视频会议终端输入的声音数据转化为数字信号后传输给其他用户的视频会议终端；
若实时采集的当前图像中没有人像或者该用户未讲话，则将该用户的视频会议终端输入的声音数据屏蔽。

2.根据权利要求1所述的方法，其特征在于，所述基于采集的预设时长的图像判断该用户是否在讲话，包括：
对预设时长的图像进行面部定位，以提取出多幅面部图像；
对所述多幅面部图像分别进行面部器官定位，以提取出多幅嘴部及喉部部分的局部特征图像；以及，
基于所述多幅嘴部及喉部部分的局部特征图像判断该用户是否在讲话。

3.根据权利要求2所述的方法，其特征在于，所述基于所述多幅嘴部及喉部部分的局部特征图像判断该用户是否在讲话，包括：
分别计算所述多幅嘴部及喉部部分的局部特征图像的特征值；
判断所述多幅嘴部及喉部部分的局部特征图像的特征值是否有运动变化；
若是，则判定该用户在讲话；
若否，则判定该用户未讲话。

4.根据权利要求3所述的方法，其特征在于，在判断为所述多幅嘴部及喉部部分的局部特征图像的特征值有运动变化之后，还包括：
获取该用户的说话口型模型；
判断所述多幅嘴部及喉部部分的局部特征图像的特征值的运动变化情况是否与该用户的说话口型模型相匹配；
若是，则判定该用户在讲话；
若否，则判定该用户未讲话。

5.根据权利要求1所述的方法，其特征在于，在各个用户参加网络视频会议之前，还包括：
预先获取各个用户的第一面部特征；
在判断为实时采集的当前图像中有人像之后，还包括：
对当前图像进行识别以得出该用户的第二面部特征；
将该用户的第二面部特征与其第一面部特征进行对比，并根据对比结果判断当前图像中的人像是否为该用户本人；
若是，则执行基于采集的预设时长的图像判断该用户是否在讲话的步骤；
若否，则将该用户的视频会议终端输入的声音数据屏蔽。

6.根据权利要求1-5中任一项所述的方法，其特征在于，在基于采集的预设时长的图像判断为该用户在讲话之后，还包括：
获取该用户的手机号码；
基于该用户的手机号码在...

【专利技术属性】
技术研发人员：赵慧，
申请(专利权)人：中国联合网络通信集团有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人