网络视频会议中防干扰方法、系统、设备及存储介质技术方案

技术编号:29709346 阅读:20 留言:0更新日期:2021-08-17 14:40
本公开提供一种网络视频会议中防干扰方法、系统、设备及存储介质,其中的方法包括:预先获取各个用户的第一声纹特征;在各个用户参加网络视频会议的过程中,连续采集每个用户的视频会议终端输入的声音数据并进行实时处理以依次识别出该用户的多段第二声纹特征;对于每个用户依次计算其多段第二声纹特征与第一声纹特征的相似度;分别判断该用户的每段第二声纹特征与第一声纹特征的相似度计算结果是否超过预设的相似度阈值;若是,则将该用户的该段第二声纹特征对应的声音数据转化为数字信号后传输给其他用户的终端;若否,则将该用户的该段第二声纹特征对应的声音数据屏蔽。本公开提供的技术方案可以解决网络视频会议过程中存在干扰音的问题。

【技术实现步骤摘要】
网络视频会议中防干扰方法、系统、设备及存储介质
本公开涉及通信
,尤其涉及一种网络视频会议中防干扰方法、一种网络视频会议中防干扰系统、一种计算机设备以及一种计算机可读存储介质。
技术介绍
随着互联网技术的发展,远程办公越来越常见,而网络视频会议是远程办公必不可少的沟通交流方式之一。但是在开会过程中,经常由于与会者所处环境存在其他声音输入,如身边有人在说话或者发出其他噪音而打断主讲人的讲话,也影响其他与会者的听力理解质量,但是输入干扰音的与会者其本人往往并没有意识到自己这边的环境声音输入影响到了大家。目前,这类情况通常的解决方法是,如果某一与会者的环境声音输入影响到了其他与会者,需要其他与会者通知输入干扰音的与会者关闭话筒,但此前的干扰影响已经形成了,不可挽回;或者,在会议开始前,除了主讲人外,其他与会者都关闭话筒,但是当其他与会者想在会议中发表讲话时,还需要手动打开话筒,使用非常不便;或者,所有与会者都寻找一个较为安静的环境参加网络视频会议,但此环境不仅需要安静,同时还要满足一定的网络要求,条件较为苛刻,难以满足。因此,目前亟待提出一种可以解决网络视频会议过程中存在干扰音的问题的方案。
技术实现思路
为了至少部分解决现有技术中存在的技术问题而完成了本公开。根据本公开实施例的一方面,提供一种网络视频会议中防干扰方法,所述方法包括:预先获取各个用户的第一声纹特征;在各个用户参加网络视频会议的过程中,连续采集每个用户的视频会议终端输入的声音数据,并分别对每个用户的视频会议终端输入的声音数据进行实时处理以依次识别出各用户的多段第二声纹特征;对于每个用户,依次计算其多段第二声纹特征与第一声纹特征的相似度;分别判断该用户的每段第二声纹特征与第一声纹特征的相似度计算结果是否超过预设的相似度阈值;若是,则将该用户的该段第二声纹特征对应的声音数据转化为数字信号后传输给其他用户的视频会议终端;若否,则将该用户的该段第二声纹特征对应的声音数据屏蔽。根据本公开实施例的另一方面,提供一种网络视频会议中防干扰系统,所述系统包括:获取模块,其设置为预先获取各个用户的第一声纹特征;声音采集模块,其设置为在各个用户参加网络视频会议的过程中,连续采集每个用户的视频会议终端输入的声音数据;声纹识别模块,其设置为分别对所述声音采集模块采集的每个用户的视频会议终端输入的声音数据进行实时处理以依次识别出各用户的多段第二声纹特征;相似度计算模块,其设置为对于每个用户,依次计算其多段第二声纹特征与第一声纹特征的相似度;判断模块,其设置为分别判断该用户的每段第二声纹特征与第一声纹特征的相似度计算结果是否超过预设的相似度阈值;转化模块,其设置为在所述判断模块的判断结果为超过预设的相似度阈值时,将该用户的该段第二声纹特征对应的声音数据转化为数字信号;传输模块,其设置为将所述转化模块转化成的数字信号传输给其他用户的视频会议终端;以及,屏蔽模块,其设置为在所述判断模块的判断结果为不超过预设的相似度阈值时,将该用户的该段第二声纹特征对应的声音数据屏蔽。根据本公开实施例的又一方面,提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,当所述处理器运行所述存储器存储的计算机程序时,所述处理器执行前述网络视频会议中防干扰方法。根据本公开实施例的再一方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,所述处理器执行前述网络视频会议中防干扰方法。本公开的实施例提供的技术方案可以包括以下有益效果:本公开实施例提供的网络视频会议中防干扰方法,通过将各个与会者的视频会议终端输入的声音数据识别为声纹特征,再与预先获取的该与会者本人的声纹特征进行相似度计算,只有计算结果超过预设相似度阈值的声纹特征对应的声音数据才被转化为数字信号后传输给其他用户的视频会议终端,而不超过预设相似度阈值的声纹特征对应的声音数据则作为干扰音被直接屏蔽掉,避免影响到其他与会者,从而有效解决网络视频会议过程中存在干扰音的问题,保证了网络视频会议质量。本公开的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本公开而了解。本公开的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。附图说明附图用来提供对本公开技术方案的进一步理解,并且构成说明书的一部分,与本公开的实施例一起用于解释本公开的技术方案,并不构成对本公开技术方案的限制。图1为本公开实施例提供的网络视频会议中防干扰方法的流程示意图;图2为本公开实施例提供的网络视频会议中防干扰系统的结构示意图;图3为本公开实施例提供的计算机设备的结构示意图。具体实施方式为使本公开实施例的目的、技术方案和优点更加清楚,以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序;并且,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互任意组合。在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本公开的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。图1为本公开实施例提供的网络视频会议中防干扰方法的流程示意图。如图1所示,所述方法包括如下步骤S101至S106。S101.预先获取各个用户的第一声纹特征,用于后续身份认证;S102.在各个用户参加网络视频会议的过程中,连续采集每个用户的视频会议终端输入的声音数据,并分别对每个用户的视频会议终端输入的声音数据进行实时处理以依次识别出各用户的多段第二声纹特征;本步骤中,针对每个用户,都连续采集其视频会议终端输入的声音数据;在会议上,由于发言方讲话时每两句话之间往往会存在停顿,便于其他与会者的听力理解,相应地,连续采集的发言方的视频会议终端输入的声音数据就是一段一段的声音数据,那么分别对这些段声音数据进行实时处理,就可以依次识别出多段第二声纹特征,其中每一段声音数据对应一段第二声纹特征;需要说明的是,各用户的第二声纹特征是基于其视频会议终端输入的声音数据识别出的,而各用户的视频会议终端输入的声音可能是该用户本人发出的声音,也可能是外界干扰音;S103.对于每个用户,依次计算其多段第二声纹特征与第一声纹特征的相似度;S104.分别判断该用户的每段第二声纹特征与第一声纹特征的相似度计算结果是否超过预设的相似度阈值,若是,则执行步骤S105;若否,则执行步骤S106;S105.将该用户的该段第二声纹特征对应的声音数据转化为数字信号后传输给其他用户的视频会本文档来自技高网...

【技术保护点】
1.一种网络视频会议中防干扰方法,其特征在于,包括:/n预先获取各个用户的第一声纹特征;/n在各个用户参加网络视频会议的过程中,连续采集每个用户的视频会议终端输入的声音数据,并分别对每个用户的视频会议终端输入的声音数据进行实时处理以依次识别出各用户的多段第二声纹特征;/n对于每个用户,依次计算其多段第二声纹特征与第一声纹特征的相似度;/n分别判断该用户的每段第二声纹特征与第一声纹特征的相似度计算结果是否超过预设的相似度阈值;/n若是,则将该用户的该段第二声纹特征对应的声音数据转化为数字信号后传输给其他用户的视频会议终端;/n若否,则将该用户的该段第二声纹特征对应的声音数据屏蔽。/n

【技术特征摘要】
1.一种网络视频会议中防干扰方法,其特征在于,包括:
预先获取各个用户的第一声纹特征;
在各个用户参加网络视频会议的过程中,连续采集每个用户的视频会议终端输入的声音数据,并分别对每个用户的视频会议终端输入的声音数据进行实时处理以依次识别出各用户的多段第二声纹特征;
对于每个用户,依次计算其多段第二声纹特征与第一声纹特征的相似度;
分别判断该用户的每段第二声纹特征与第一声纹特征的相似度计算结果是否超过预设的相似度阈值;
若是,则将该用户的该段第二声纹特征对应的声音数据转化为数字信号后传输给其他用户的视频会议终端;
若否,则将该用户的该段第二声纹特征对应的声音数据屏蔽。


2.根据权利要求1所述的方法,其特征在于,所述预先获取各个用户的第一声纹特征,包括:
在每个用户注册网络视频会议软件账号时,采集该用户本人预设时长的声音数据;以及,
对所采集的该用户本人的声音数据进行预处理,再对预处理后的声音数据进行识别以得出该用户的第一声纹特征。


3.根据权利要求1所述的方法,其特征在于,所述分别对每个用户的视频会议终端输入的声音数据进行实时处理以依次识别出各用户的多段第二声纹特征,具体为:
将每个用户的视频会议终端输入的声音数据先进行实时的维纳滤波处理和词嵌入语谱图降维处理,再输入至联合训练后的深度卷积神经网络和长短期记忆网络模型从而依次识别出各用户的多段第二声纹特征。


4.根据权利要求1-3中任一项所述的方法,其特征在于,在将该用户的该段第二声纹特征对应的声音数据屏蔽之后,还包括:
向该用户的视频会议终端发送提示信息,以使该用户的视频会议终端弹出关于该用户当前有干扰音输入的提醒。


5.一种网络视频会议中防干扰系统,其特征在于,包括:
获取模块,其设置为预先获取各个用户的第一声纹特征;
声音采集模块,其设置为在各个用户参加网络视频会议的过程中,连续采集每个用户的视频会议终端输入的声音数据;
声纹识别模块,其设置为分别对所述声音采集模块采集的每个用户的视频会议终端输入的声音数据进行实时处理以依次识别出各用户的多段第二声纹特征;
相似度计算模块,其设置为对于每个用户,依次计算其多段第二声纹特征与第一声纹特征...

【专利技术属性】
技术研发人员:赵慧
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1