语音数据匹配方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:24253135 阅读:38 留言:0更新日期:2020-05-23 00:25
本发明专利技术公开了一种语音数据匹配方法、装置、计算机设备及存储介质。所述方法包括:获取语音数据和关联用户信息,其中,所述关联用户信息为与所述语音数据相关联的用户信息;对所述语音数据进行声纹识别,确定所述语音数据的发声用户;建立所述发声用户和关联用户信息的第一潜在映射关系;将历史映射关系和所述第一潜在映射关系进行计算,得到所述语音数据中每一所述发声用户的匹配身份信息。本发明专利技术的技术方案减少了语音识别身份的大量运算量,提高了语音识别身份的效率。

Speech data matching method, device, computer equipment and storage medium

【技术实现步骤摘要】
语音数据匹配方法、装置、计算机设备及存储介质
本专利技术涉及计算机
,尤其涉及一种语音数据匹配方法、装置、计算机设备及存储介质。
技术介绍
随着计算机技术的不断发展,越来越多的应用场景由人工操作开始主编转变为由计算机代替实现。示例性地,在很多会议场合中,都需要对会议的发言进行记录,以形成会议记录。而随着自然语言处理技术的不断发展,目前很多会议可以通过计算机设备进行对语音的采集和识别。但是,在目前的识别过程中,往往较难确定发音的用户的具体身份。通常,需要预先建立每一用户的个人数据(例如,声纹数据),再通过该个人数据对语音数据进行匹配、判断来确定用户的身份。无法实现真正的智能化识别和判断,使得该匹配过程较为繁琐和复杂。
技术实现思路
本专利技术实施例提供一种语音数据匹配方法、装置、计算机设备及存储介质,以解决对语音数据匹配过程中的标记或者身份识别的过程较为繁琐的问题。一种语音数据匹配方法,包括:获取语音数据和关联用户信息,其中,所述关联用户信息为与所述语音数据相关联的用户信息;对所述语音数据进行声纹识别,确定所述语音数据中的发声用户,其中,所述发声用户为至少一个;建立所述发声用户和关联用户信息的第一潜在映射关系;根据所述第一潜在映射关系和历史映射关系进行计算,得到所述语音数据中每一所述发声用户的匹配身份信息。一种语音数据匹配装置,包括:数据获取模块,用于获取语音数据和关联用户信息,其中,所述关联用户信息为与所述语音数据相关联的用户信息;r>数据识别模块,用于对所述语音数据进行声纹识别,确定所述语音数据中的发声用户,其中,所述发声用户为至少一个;关系建立模块,用于建立所述发声用户和关联用户信息的第一潜在映射关系;关系计算模块,用于根据所述第一潜在映射关系和历史映射关系进行计算,得到所述语音数据中每一所述发声用户的匹配身份信息。一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述语音数据匹配方法的步骤。一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述语音数据匹配方法的步骤。上述语音数据匹配方法、装置、计算机设备及存储介质中,首先,获取语音数据和关联用户信息,通过对语音数据进行声纹识别,确定语音数据中的发声用户,进一步地,建立发声用户和关联用户信息的第一潜在映射关系,根据第一潜在映射关系和历史映射关系进行计算,得到语音数据中每一发声用户的匹配身份信息。能够在第一潜在映射关系和历史映射关的计算中,提高对语音数据中每一发声用户的身份匹配的准确率,避免了大量的算法运算,提高语音数据的发声用户身份匹配的效率。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一实施例中语音数据匹配方法的一应用环境示意图;图2是本专利技术一实施例中语音数据匹配方法的一流程图;图3是本专利技术一实施例中语音数据匹配方法的一流程图;图4是本专利技术一实施例中语音数据匹配方法的步骤S13的一流程图;图5是本专利技术一实施例中语音数据匹配方法中的一流程图;图6是本专利技术一实施例中语音数据匹配方法中的一流程图;图7是本专利技术一实施例中语音数据匹配装置的一示意图;图8是本专利技术一实施例中计算机设备的一示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本申请提供的语音数据匹配方法,可应用在如图1所示的应用环境中,该应用环境包括服务端和客户端,其中,服务端和应用客户端之间通过网络进行连接,该网络可以是有线网络或者无线网络,客户端具体包括但不限于各种个人计算机、笔记本电脑、智能手机和平板电脑和便携式可穿戴设备,服务端具体可以用独立的服务器或者多个服务器组成的服务器集群实现。服务端获取语音数据和关联用户信息,通过对语音数据进行声纹识别,确定语音数据中的发声用户,进一步地,建立发声用户和关联用户信息的第一潜在映射关系,根据第一潜在映射关系和历史映射关系进行计算,得到语音数据中每一发声用户的匹配身份信息。在一实施例中,如图2所示,提供一种语音数据匹配方法,以该方法应用在图1中的服务端为例进行说明,具体包括步骤S10至步骤S40,详述如下:S10:获取语音数据和关联用户信息,其中,关联用户信息为与语音数据相关联的用户信息。具体地,该语音数据由用户产生。其中,语音数据可以是一位用户的语音数据,也可以是包括两位以上用户的语音数据,语音数据的获取可以是通过语音采集设备实时获取,例如麦克风;也可以是通过语音采集设备离线获取,例如通过录音设备得到语音文件后,从录音设备提取语音文件,得到语音数据。关联用户信息为与语音数据相关联的用户信息,关联用户信息可以是一位用户的用户信息,也可以是两位以上用户的用户信息。其中,语音数据与用户信息的关联,具体可以是:语音数据由用户信息中的用户所产生;也可以是,语音数据需要转发的对象为用户信息中的用户。进一步的,关联用户信息的获取可以是:通过对语音数据的转发过程中,在数据库中保存的用户信息中获取。示例性地,在一应用场景中,需要将语音数据以邮箱的形式转发给关联用户:a用户、b用户、c用户,并将a用户、b用户、c用户的信息保存至数据库中,然后从数据库中获取a用户、b用户、c用户的信息。例如,提取该邮件中的收件人、抄送人、发件人等,得到关联用户信息。S20:对语音数据进行声纹识别,确定语音数据中的发声用户,其中,发声用户为至少一个。具体地,将获取到的语音数据进行声纹识别处理,其中,声纹识别可以是按照预设的声纹特征对语音数据进行声纹特征提取,其中,预设的声纹特征可以是:(1)声学特征,如倒频谱;(2)词法特征;(3)韵律特征;(4)语种、方言和口音信息;(5)通道信息。发声用户为产生语音数据的用户,至少为一个。可以理解地,语音数据的发声用户为:产生的语音数据的用户,其中,语音数据带有用户的声纹特征。进一步地,语音数据中的发声用户的确定,可以是根据提取的声纹特征,通过数据库中预设历史映射关系确定,也可以用户自定义确定。示例性地,在一应用场景中,获取一段语音数据,按照声学特征和通道信息,对语音数据进行特征提取,提取后得到A、B两种声纹特征。关联用户信息包括:a用户信息、b用户信息、c用户信息。预设的历史映射关系为:A映射a;B映射c。语音数据中的发声用户为a用户和b用户。S30本文档来自技高网...

【技术保护点】
1.一种语音数据匹配方法,其特征在于,所述语音数据匹配方法包括:/n获取语音数据和关联用户信息,其中,所述关联用户信息为与所述语音数据相关联的用户信息;/n对所述语音数据进行声纹识别,确定所述语音数据中的发声用户,其中,所述发声用户为至少一个;/n建立所述发声用户和关联用户信息的第一潜在映射关系;/n根据所述第一潜在映射关系和历史映射关系进行计算,得到所述语音数据中每一所述发声用户的匹配身份信息。/n

【技术特征摘要】
1.一种语音数据匹配方法,其特征在于,所述语音数据匹配方法包括:
获取语音数据和关联用户信息,其中,所述关联用户信息为与所述语音数据相关联的用户信息;
对所述语音数据进行声纹识别,确定所述语音数据中的发声用户,其中,所述发声用户为至少一个;
建立所述发声用户和关联用户信息的第一潜在映射关系;
根据所述第一潜在映射关系和历史映射关系进行计算,得到所述语音数据中每一所述发声用户的匹配身份信息。


2.如权利要求1所述的语音数据匹配方法,其特征在于,在所述得到所述语音数据中每一所述发声用户的匹配身份信息之后,所述语音数据匹配还包括:
按照预设的方式截取所述语音数据中的部分语音数据,得到待判断语音数据;
将所述待判断语音数据发送至所述关联用户信息所对应的客户端,以指示用户对所述待判断语音数据对应的所述发声用户进行判断;
接收所述客户端返回的判断结果信息,根据所述判断结果信息,建立所述待判断语音数据对应的发声用户和关联用户信息的第二潜在映射关系;
根据所述第二潜在映射关系、所述第一潜在映射关系和所述历史映射关系进行计算,更新所述语音数据中每一所述发声用户的匹配身份信息。


3.如权利要求2所述的语音数据匹配方法,其特征在于,所述接收所述客户端返回的判断结果信息,根据所述判断结果信息,建立所述待判断语音数据对应的发声用户和关联用户信息的第二潜在映射关系,包括:
对每一客户端返回的判断结果信息中的指示用户进行统计;
若任一指示用户的数量超过预设的阈值,则根据所述超过预设的阈值的指示用户建立所述第二潜在映射关系。


4.如权利要求1所述的语音数据匹配方法,其特征在于,在所述根据所述第一潜在映射关系和历史映射关系进行计算,得到所述语音数据中每一所述发声用户的匹配身份信息之后,还包括:
将所述语音数据转换成文本数据;
根据所述语音数据中每一所述发声用户的匹配身份信息,将所述关联用户信息与所述文本数据按照预设的格式输出。


5.如权利要求1所述的语音数据匹配方法,其特征在于,在所述将历史映射关系和所述第一潜在映射关系进行计算,得到所述语音数据中每一所述发声用户的匹配身份信息之后,包括:
...

【专利技术属性】
技术研发人员:黄华军刘长冬
申请(专利权)人:拉克诺德深圳科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1