会议发言控制方法、系统、电子设备及存储介质技术方案

技术编号:26069303 阅读:21 留言:0更新日期:2020-10-28 16:42
本发明专利技术实施例提供一种会议发言控制方法、系统、电子设备及存储介质,首先获取目标会议任一参会终端采集的音频文件;其次,基于音频文件进行参会人识别;再次,若参会人识别的结果为是,则基于音频文件的音频信息、从音频文件中提取的发言内容信息,以及任一参会终端采集的视频文件的人脸信息中的至少一种,对音频文件进行会议内容识别;最后,若会议内容识别的结果为是,则将音频文件发送至目标会议的其他参会终端。可以不需要会议主持人的提醒,直接进行自动判断是否需要关闭语音采集设备。而且,在进行自动判断时,采用了参会人识别以及会议内容识别相结合的方式,可以使得识别结果更加准确。

【技术实现步骤摘要】
会议发言控制方法、系统、电子设备及存储介质
本专利技术涉及计算机信号处理
,尤其涉及一种会议发言控制方法、系统、电子设备及存储介质。
技术介绍
随着远程办公的迅速发展,远程音视频会议逐渐得到广泛应用。在远程音视频会议场景中,通常在同一个会议中包含有多人,这些人共同实现线上参会。在同一个会议场所中,参会人之间的距离一般很近,参会人在接电话或者和其他人讨论问题等处理非会议内容时,如果没有及时关闭对应的语音采集设备,将会影响其他参会人发言、讨论。现有的方法通常是通过会议主持人提醒参会人手动关闭对应的语音采集设备,或者会议系统根据预先设定的每个语音采集设备的位置信息,自动判断是否需要关闭语音采集设备。然而,通过会议主持人提醒的方式很容易由于会议主持人的参与而扰乱会议的正常进行。而通过会议系统自动判断是否需要关闭语音采集设备的方式,由于语音采集设备通常是参会人的个人电脑携带的麦克风,无法预先知晓每个参会人对应的麦克风的位置信息,进而无法保证自动判断的结果的准确性。
技术实现思路
本专利技术实施例提供一种会议发言控制方法、系统、电子设备及存储介质,用以解决现有技术中存在的缺陷。本专利技术实施例提供一种会议发言控制方法,包括:获取目标会议任一参会终端采集的音频文件;基于所述音频文件进行参会人识别;若所述参会人识别的结果为是,则基于所述音频文件的音频信息、从所述音频文件中提取的发言内容信息,以及所述任一参会终端采集的视频文件的人脸信息中的至少一种,对所述音频文件进行会议内容识别;若所述会议内容识别的结果为是,则将所述音频文件发送至所述目标会议的其他参会终端。优选地,所述基于所述音频文件的音频信息、从所述音频文件中提取的发言内容信息,以及所述任一参会终端采集的视频文件的人脸信息中的至少一种,对所述音频文件进行会议内容识别,具体包括:基于所述音频文件的音频信息,和/或所述视频文件的人脸信息,对所述音频文件进行会议内容的初步识别;若初步识别的结果为是,则基于所述发言内容信息,对所述音频文件进行会议内容的精细识别。优选地,所述基于所述音频文件的音频信息,和/或所述视频文件的人脸信息,对所述音频文件进行会议内容的初步识别,具体包括:基于所述音频信息中的声源位置信息、所述音频信息中的声源声音能量以及所述人脸信息中的发言人嘴巴活动特征中的至少一种,对所述音频文件进行会议内容初步识别。优选地,所述基于所述发言内容信息,对所述音频文件进行会议内容的精细识别,具体包括:计算所述发言内容信息与所述目标会议的会议主题之间的第一相似度,和/或所述发言内容信息与历史发言内容信息之间的第二相似度;基于所述第一相似度和/或所述第二相似度,对所述音频文件进行会议内容的精细识别。优选地,所述计算所述发言内容信息与所述目标会议的会议主题之间的第一相似度,和/或所述发言内容信息与历史发言内容信息之间的第二相似度,具体包括:将所述发言内容信息与所述目标会议的会议主题分别输入至文本相似度判断模型,得到由所述文本相似度判断模型输出的第一相似度;和/或,将所述发言内容信息与所述历史发言内容信息分别输入至所述文本相似度判断模型,得到由所述文本相似度判断模型输出的第二相似度。优选地,所述基于所述音频文件进行参会人识别,具体包括:基于预先确定的声纹特征与账号信息的绑定关系,确定所述音频文件的声纹特征对应的第一账号信息;基于所述第一账号信息,进行参会人识别。优选地,所述基于所述第一账号信息,进行参会人识别,具体包括:若所述第一账号信息存在于所述目标会议的参会人账号列表中,则确定所述参会人识别的结果为是;否则,获取所述任一参会终端采集的视频文件的人脸特征;基于预先确定的人脸特征与账号信息的绑定关系,确定所述视频文件的人脸特征对应的第二账号信息;若所述第二账号信息存在于所述目标会议的参会人账号列表中,则确定所述参会人识别的结果为是,否则确定所述参会人识别的结果为否。本专利技术实施例还提供一种会议发言控制系统,包括:声纹特征获取模块,用于获取目标会议任一参会终端采集的音频文件;参会人识别模块,用于基于所述音频文件进行参会人识别;会议内容识别模块,用于若所述参会人识别的结果为是,则基于所述音频文件的音频信息、从所述音频文件中提取的发言内容信息,以及所述任一参会终端采集的视频文件的人脸信息中的至少一种,对所述音频文件进行会议内容识别;发送模块,用于若所述会议内容识别的结果为是,则将所述音频文件发送至所述目标会议的其他参会终端。本专利技术实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述会议发言控制方法的步骤。本专利技术实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述会议发言控制方法的步骤。本专利技术实施例提供的会议发言控制方法、系统、电子设备及存储介质,可以不需要会议主持人的提醒,直接进行自动判断是否需要关闭语音采集设备。而且,在进行自动判断时,采用了参会人识别以及会议内容识别相结合的方式,可以使得识别结果更加准确。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种会议发言控制方法的流程示意图;图2是本专利技术实施例提供的一种会议发言控制方法的完整流程示意图;图3是本专利技术实施例提供的一种会议发言控制系统的结构示意图;图4是本专利技术实施例提供的一种电子设备的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。目前,在远程音视频会议场景中,通常采用通过会议主持人提醒参会人手动关闭对应的语音采集设备,或者通过自动判断是否需要关闭语音采集设备的方式,避免参会人在接电话或者和其他人讨论问题等处理非会议内容时,因没有及时关闭对应的语音采集设备,对其他参会人发言、讨论产生的影响。然而,通过会议主持人提醒的方式很容易由于会议主持人的参与而扰乱会议的正常进行。而通过会议系统自动判断是否需要关闭语音采集设备的方式,由于语音采集设备通常是参会人的个人电脑携带的麦克风,无法预先知晓每个参会人对应的麦克风的位置信息,进而无法保证自动判断的结果的准确性。为此,本文档来自技高网...

【技术保护点】
1.一种会议发言控制方法,其特征在于,包括:/n获取目标会议任一参会终端采集的音频文件;/n基于所述音频文件进行参会人识别;/n若所述参会人识别的结果为是,则基于所述音频文件的音频信息、从所述音频文件中提取的发言内容信息,以及所述任一参会终端采集的视频文件的人脸信息中的至少一种,对所述音频文件进行会议内容识别;/n若所述会议内容识别的结果为是,则将所述音频文件发送至所述目标会议的其他参会终端。/n

【技术特征摘要】
1.一种会议发言控制方法,其特征在于,包括:
获取目标会议任一参会终端采集的音频文件;
基于所述音频文件进行参会人识别;
若所述参会人识别的结果为是,则基于所述音频文件的音频信息、从所述音频文件中提取的发言内容信息,以及所述任一参会终端采集的视频文件的人脸信息中的至少一种,对所述音频文件进行会议内容识别;
若所述会议内容识别的结果为是,则将所述音频文件发送至所述目标会议的其他参会终端。


2.根据权利要求1所述的会议发言控制方法,其特征在于,所述基于所述音频文件的音频信息、从所述音频文件中提取的发言内容信息,以及所述任一参会终端采集的视频文件的人脸信息中的至少一种,对所述音频文件进行会议内容识别,具体包括:
基于所述音频文件的音频信息,和/或所述视频文件的人脸信息,对所述音频文件进行会议内容的初步识别;
若初步识别的结果为是,则基于所述发言内容信息,对所述音频文件进行会议内容的精细识别。


3.根据权利要求2所述的会议发言控制方法,其特征在于,所述基于所述音频文件的音频信息,和/或所述视频文件的人脸信息,对所述音频文件进行会议内容的初步识别,具体包括:
基于所述音频信息中的声源位置信息、所述音频信息中的声源声音能量以及所述人脸信息中的发言人嘴巴活动特征中的至少一种,对所述音频文件进行会议内容初步识别。


4.根据权利要求2所述的会议发言控制方法,其特征在于,所述基于所述发言内容信息,对所述音频文件进行会议内容的精细识别,具体包括:
计算所述发言内容信息与所述目标会议的会议主题之间的第一相似度,和/或所述发言内容信息与历史发言内容信息之间的第二相似度;
基于所述第一相似度和/或所述第二相似度,对所述音频文件进行会议内容的精细识别。


5.根据权利要求4所述的会议发言控制方法,其特征在于,所述计算所述发言内容信息与所述目标会议的会议主题之间的第一相似度,和/或所述发言内容信息与历史发言内容信息之间的第二相似度,具体包括:
将所述发言内容信息与所述目标会议的会议主题分别输入至文本相似度判断模型,得...

【专利技术属性】
技术研发人员:张晓燕解斐
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1