参会人声纹识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:30798487 阅读:51 留言:0更新日期:2021-11-16 08:03
本公开提供一种参会人声纹识别方法、装置、电子设备及存储介质。该方法包括:获取会议中当前正在发声的目标参会人的语音信号;从语音信号中提取目标参会人的声纹特征;将语音信号转换成文字信息;响应于通过比对而确定声纹特征库中不包括声纹特征,获取目标参会人的第一身份信息,将声纹特征与第一身份信息相关联地添加到声纹特征库中,并将文字信息与第一身份信息相关联地保存到会议记录中。这样在形成的会议记录中,就可以很明确的得知说话人是谁,以及说话的内容是什么,整个过程能够实时完成,无需在会议前进行声纹录入,使得整个会议记录更加智能,并且整个过程能够在参会人无感知的情况下完成,提高了参会人员的参与体验。验。验。

【技术实现步骤摘要】
参会人声纹识别方法、装置、电子设备及存储介质


[0001]本公开涉及语音处理
,尤其涉及一种参会人声纹识别方法、装置、电子设备及存储介质。

技术介绍

[0002]一个企业可能会组织各种会议,需要对会议进行记录,传统的会议记录方式是对会议进行录音,这样在对会议进行总结时,往往需要来回播放录音内容,并且由于对会议中的有些人并不熟悉,因此对于录音内容属于谁的发言,就会出现混乱。
[0003]基于上述情况,现有技术中采用声纹识别的方式进行人物身份识别,但是这种方式往往需要预先存储各个参会人的声纹特征。对于没有预先存储声纹特征的新参会人,无法通过其发声来辨别其身份。

技术实现思路

[0004]有鉴于此,本公开的目的在于提出一种参会人声纹识别方法、装置、电子设备及存储介质用以解决或部分解决上述技术问题。
[0005]基于上述目的,本公开的第一方面提供了一种参会人声纹识别方法,包括:
[0006]获取会议中当前正在发声的目标参会人的语音信号;
[0007]从所述语音信号中提取所述目标参会人的声纹特征;
[0008]将所述语音信号转换成文字信息;
[0009]响应于通过比对而确定声纹特征库中不包括所述声纹特征,获取所述目标参会人的第一身份信息,将所述声纹特征与所述第一身份信息相关联地添加到所述声纹特征库中,并将所述文字信息与所述第一身份信息相关联地保存到会议记录中。
[0010]本公开的第二方面提供了一种参会人声纹识别装置,包括:
[0011]获取模块,被配置为获取会议中当前正在发声的目标参会人的语音信号;
[0012]声纹提取模块,被配置为从所述语音信号中提取所述目标参会人的声纹特征;
[0013]文字转换模块,被配置为将所述语音信号转换成文字信息;
[0014]关联保存模块,被配置为响应于通过比对而确定声纹特征库中不包括所述声纹特征,获取所述目标参会人的第一身份信息,将所述声纹特征与所述第一身份信息相关联地添加到所述声纹特征库中,并将所述文字信息与所述第一身份信息相关联地保存到会议记录中。
[0015]本公开的第三方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述的方法。
[0016]本公开的第四方面提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机执行第一方面所述方法。
[0017]从上面所述可以看出,本公开提供的参会人声纹识别方法、装置、电子设备及存储
介质,能够实时采集会议中当前正在发声的目标参会人的语音信号,并实时确定目标参会人的声纹特征,并将声纹特征与目标参会人的第一身份信息进行关联,这样就可以在该目标参会人语音信号对应转换得到的文字信息上,标记目标参会人的第一身份信息进而形成会议记录。这样在形成的会议记录中,就可以很明确的得知说话人是谁,以及说话的内容是什么,整个过程能够实时完成,无需在会议前进行声纹录入,使得整个会议记录更加智能,并且整个过程能够在参会人无感知的情况下完成,提高了参会人员的参与体验。
附图说明
[0018]为了更清楚地说明本公开或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1为本公开一个实施例的参会人声纹识别方法的流程图;
[0020]图2为本公开实施例的第一身份信息的一个获取流程图;
[0021]图3为步骤202的步骤展开的一个示意图;
[0022]图4为步骤202的步骤展开的另一个示意图;
[0023]图5为步骤202的步骤展开示意图;
[0024]图6为步骤501的步骤展开示意图;
[0025]图7为步骤503的步骤展开示意图
[0026]图8为步骤3021或步骤701的步骤展开示意图;
[0027]图9为本公开实施例的第一身份信息的另一个获取流程图
[0028]图10为本公开实施例的第一身份信息的再一个获取流程图;
[0029]图11为本公开另一个实施例的参会人声纹识别方法的流程图;
[0030]图12为本公开再一个实施例的参会人声纹识别方法中的方案一的具体参会人员的示意图;
[0031]图13为本公开再一个实施例的参会人声纹识别方法中的方案二的具体参会人员的示意图;
[0032]图14为本公开实施例的参会人声纹识别装置的结构框图;
[0033]图15为本公开实施例的电子设备的结构图。
具体实施方式
[0034]为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。
[0035]需要说明的是,除非另外定义,本公开实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接
的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
[0036]相关技术中一般采用的对于一段随机的文字信息,或者指定的一段文字信息,让用户进行阅读,并采集阅读过程中的语音,并保存这段录音文件,利用声纹注册的录音文件进行声纹注册。这种声纹识别方式不能进行实时的声纹特征提取和录入。
[0037]另外,相关技术中还有收集音频信息,对音频信息中的声纹特征进行分类,并确定该声纹特征对应关联的用户,进而不断的扩展用户的声纹特征,进而提高声纹识别的精度。但是这种方式同样也是对收集的音频信息进行声纹采集,并不能进行实时的声纹识别和录入。
[0038]本公开的实施例提供一种参会人声纹识别方法,可以在安装对应客户端的终端设备上执行,也可以在对应的会议记录设备上执行。
[0039]如图1所示,本实施例的方法包括:
[0040]步骤101,获取会议中当前正在发声的目标参会人的语音信号。
[0041]在该步骤中,通过收音设备(例如,麦克风)对会议中当前正在发声的目标参会人进行语音收集,对应的收音设备可以对应设置一个或多个。如果是多个,各个收音设备的位置可以根据会议室的实际情况进行安放。
[0042]步骤102,从语音信号中提取目标参会人的声纹特征。
[0043]在该步骤中,声纹特征采用文本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种参会人声纹识别方法,其特征在于,包括:获取会议中当前正在发声的目标参会人的语音信号;从所述语音信号中提取所述目标参会人的声纹特征;将所述语音信号转换成文字信息;响应于通过比对而确定声纹特征库中不包括所述声纹特征,获取所述目标参会人的第一身份信息,将所述声纹特征与所述第一身份信息相关联地添加到所述声纹特征库中,并将所述文字信息与所述第一身份信息相关联地保存到会议记录中。2.根据权利要求1所述的方法,其特征在于,还包括:响应于通过所述比对而确定所述声纹特征库中包括所述声纹特征,从所述声纹特征库中提取与所述声纹特征对应的第二身份信息,并将所述文字信息与所述第二身份信息相关联地保存到所述会议记录中。3.根据权利要求1或2所述的方法,其特征在于,所述获取所述目标参会人的第一身份信息包括:根据所述语音信号确定目标参会人的人物位置信息;根据所述人物位置信息对在会议室中布置的图像采集器进行方位调节,利用所述图像采集器采集所述目标参会人的身份图像;提取所述身份图像中的字符信息,将所述字符信息作为所述目标参会人的第一身份信息。4.根据权利要求3所述的方法,其特征在于,所述图像采集器为可转动的图像采集器;所述根据所述人物位置信息对在会议室中布置的图像采集器进行方位调节,利用所述图像采集器采集所述目标参会人的身份图像,具体包括:根据所述人物位置信息以及所述图像采集器的当前角度确定所述图像采集器的旋转角度;控制所述图像采集器转动所述旋转角度;利用所述图像采集器对所述目标参会人的身份标志进行图像采集,得到所述身份图像。5.根据权利要求4所述的方法,其特征在于,在利用所述图像采集器对所述目标参会人的身份标志进行图像采集,得到所述身份图像之前,还包括:确定所述目标参会人的身份标志的标志位置信息;确定所述图像采集器的第一当前位置;计算所述第一当前位置与所述标志位置信息的第一距离值,根据所述第一距离值对所述图像采集器进行焦距调节。6.根据权利要求3所述的方法,其特征在于,所述图像采集器为可移动的图像采集器;根据所述人物位置信息对在会议室中布置的图像采集器进行方位调节,利用所述图像采集器采集所述目标参会人的身份图像,具体包括:根据所述人物位置信息与所述图像采集器的第二当前位置确定所述图像采集器的移动路径;控制所述图像采集器按照所述移动路径进行移动;利用移动后的图像采集器对所述目标参会人的身份标志进行图像采集,得到所述身份
图像。7.根据权利要求6所述的方法,其特征在于,所述根据所述人物位置信息与所述图像采集器的第二当前位置确定所述图像采集器的移动路径,具体包括:利用所述图像采集器采集包含有所述目标参会人的第一环境图像;从所述第一环境图像中确定所述目标参会人对应的人物图像,并在所述人物图像中提取所述目标参会人的头部位置;根据所述人物图像中人脸的朝向确定所述参会人的前方方向,并确定前方方向上距离所述头部位置预定距离的位置为目标位置;基于所述目标位置与所述图像采集器的第二当前位置确定所述图像采集器的移动路径。8.根据权利要求6所述的方法,其特征在于,所述利用移动后的图像采集器对所述目标参会人的身份标志进行图像采集,得到所述身份图像,包括:确定所述目标参会人的身份标志的标志位置信息;确定所述图像采集器的第三当前位置;...

【专利技术属性】
技术研发人员:尹小玉
申请(专利权)人:京东方科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1