声纹判定方法、装置、系统、设备和存储介质制造方法及图纸

技术编号:35737283 阅读:20 留言:0更新日期:2022-11-26 18:39
本公开公开了一种声纹判定方法、装置、系统、设备和存储介质,涉及计算机技术领域,具体涉及语音识别、深度学习等技术领域。声纹判定方法包括:在语音识别信号中添加预设标识,以得到包含预设标识的语音识别信号,所述语音识别信号包括声纹判定部分,所述预设标识用于在所述语音识别信号中确定所述声纹判定部分,所述声纹判定部分包括预设内容;将所述包含预设标识的语音识别信号,发送至服务端,以使所述服务端基于声纹模型和所述包含预设标识的语音识别信号进行声纹判定,所述声纹模型基于所述预设内容建立。本公开可以降低传输链路的数据量。据量。据量。

【技术实现步骤摘要】
声纹判定方法、装置、系统、设备和存储介质


[0001]本公开涉及计算机
,具体涉及语音识别、深度学习等
,尤其涉及一种声纹判定方法、装置、系统、设备和存储介质。

技术介绍

[0002]语音识别(speech recognition)是指将语音转换为文本,与语音识别不同,声纹判定的目的在于辨别说话者的身份(Identity)。
[0003]相关技术中,一般是采用专门的语音信号进行声纹判定,假设用于语音识别的语音信号称为语音识别信号,用于声纹判定的语音信号称为声纹判定信号,则客户端需要发送语音识别信号和声纹判定信号至服务端,服务端基于声纹判定信号进行声纹判定,基于语音识别信号进行语音识别。

技术实现思路

[0004]本公开提供了一种声纹判定方法、装置、系统、设备和存储介质。
[0005]根据本公开的一方面,提供了一种声纹判定方法,包括:在语音识别信号中添加预设标识,以得到包含预设标识的语音识别信号,所述语音识别信号包括声纹判定部分,所述预设标识用于在所述语音识别信号中确定所述声纹判定部分,所述声纹判定部分包括预设内容;将所述包含预设标识的语音识别信号,发送至服务端,以使所述服务端基于声纹模型和所述包含预设标识的语音识别信号进行声纹判定,所述声纹模型基于所述预设内容建立。
[0006]根据本公开的另一方面,提供了一种声纹判定方法,包括:接收语音识别信号,所述语音识别信号中包含预设标识,且,所述语音识别信号包括声纹判定部分,所述预设标识用于在所述语音识别信号中确定所述声纹判定部分,所述声纹判定部分包括预设内容;基于所述预设标识,确定所述语音识别信号中的所述声纹判定部分;采用声纹模型对所述声纹判定部分进行声纹判定,所述声纹模型基于所述预设内容建立。
[0007]根据本公开的另一方面,提供了一种声纹判定装置,包括:添加模块,用于在语音识别信号中添加预设标识,以得到包含预设标识的语音识别信号,所述语音识别信号包括声纹判定部分,所述预设标识用于在所述语音识别信号中确定所述声纹判定部分,所述声纹判定部分包括预设内容;发送模块,用于将所述包含预设标识的语音识别信号,发送至服务端,以使所述服务端基于声纹模型和所述包含预设标识的语音识别信号进行声纹判定,所述声纹模型基于所述预设内容建立。
[0008]根据本公开的另一方面,提供了一种声纹判定装置,包括:接收模块,用于接收语音识别信号,所述语音识别信号中包含预设标识,且,所述语音识别信号包括声纹判定部分,所述预设标识用于在所述语音识别信号中确定所述声纹判定部分,所述声纹判定部分包括预设内容;确定模块,用于基于所述预设标识,确定所述语音识别信号中的所述声纹判定部分;判定模块,用于采用声纹模型对所述声纹判定部分进行声纹判定,所述声纹模型基
于所述预设内容建立。
[0009]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上述任一方面的任一项所述的方法。
[0010]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据上述任一方面的任一项所述的方法。
[0011]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据上述任一方面的任一项所述的方法。
[0012]根据本公开的技术方案,可以降低传输链路的数据量。
[0013]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0014]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0015]图1是根据本公开第一实施例的示意图;
[0016]图2是根据本公开第二实施例的示意图;
[0017]图3是根据本公开第三实施例的示意图;
[0018]图4是根据本公开第四实施例的示意图;
[0019]图5是根据本公开第五实施例的示意图;
[0020]图6是根据本公开第六实施例的示意图;
[0021]图7是根据本公开第七实施例的示意图;
[0022]图8是根据本公开第八实施例的示意图;
[0023]图9是用来实现本公开实施例的声纹判定方法中任一方法的电子设备的示意图。
具体实施方式
[0024]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0025]图1是根据本公开第一实施例的示意图。该实施例提供一种声纹判定方法,包括:
[0026]101、在语音识别信号中添加预设标识,以得到包含预设标识的语音识别信号,所述语音识别信号包括声纹判定部分,所述预设标识用于在所述语音识别信号中确定出所述声纹判定部分,所述声纹判定部分包括预设内容。
[0027]102、将所述包含预设标识的语音识别信号,发送至服务端,以使所述服务端基于声纹模型和所述包含预设标识的语音识别信号进行声纹判定,所述声纹模型基于所述预设内容建立。
[0028]本实施例的执行主体为客户端,客户端部署在用户设备上。用户设备的具体形式
不作限定,比如,可以是智能家居终端、以及各种移动设备,移动设备比如包括:移动电话、平板计算机、手持式计算设备、PDA(个人数字助手)、便携式媒体播放器、使用头戴式受话器和耳机的设备(例如,蓝牙兼容设备)、手机平板(phablet)设备(即,组合智能电话/平板设备)、可穿戴式计算机等。智能家居终端比如为智能音箱。
[0029]客户端的形式也不作限定,可以由APP(应用)、网页或者程序等提供。APP可以显式地安装在用户设备的界面上,或者,APP也可以是用户通过特定的硬件和/或软件按钮调出,本公开对此也不作限定。
[0030]语音识别信号是指包含唤醒词和待识别内容的语音信号,比如,语音识别信号为“小度小度,明天天气”,其中,“小度小度”为唤醒词,“明天天气”为待识别内容。
[0031]声纹(Voiceprint)是携带语言信息的声波频谱。任何两个人的声纹特征都有差异,并且每个人的声纹特征具有相对稳定性。声纹判定有文本相关的(Text

Dependent)和文本无关的(Text

Independent)两种。文本相关的声纹判定要求用户按照预设内容发音,每个人的声纹模型逐个被精确地建立,声纹判定时也必须按预设内容发音。文本无关的声纹判定不要求用户按照预设内容发音本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种声纹判定方法,包括:在语音识别信号中添加预设标识,以得到包含预设标识的语音识别信号,所述语音识别信号包括声纹判定部分,所述预设标识用于在所述语音识别信号中确定所述声纹判定部分,所述声纹判定部分包括预设内容;将所述包含预设标识的语音识别信号,发送至服务端,以使所述服务端基于声纹模型和所述包含预设标识的语音识别信号进行声纹判定,所述声纹模型基于所述预设内容建立;其中,所述预设标识是基于所述语音识别信号中的声纹判定部分的端点添加的;所述端点包括:声纹判定尾点,所述预设标识添加在所述声纹判定尾点之后,所述预设内容为唤醒词;所述端点采用如下方式确定:确定语音识别信号中的唤醒时间点;以所述唤醒时间点为基准,向前回溯第一预设时长,确定为声纹判定起点;以所述声纹判定起点为基准,向后延时第二预设时长,确定为所述声纹判定尾点。2.根据权利要求1所述的方法,其中,所述确定语音识别信号中的唤醒时间点,包括:确定唤醒标识,所述唤醒标识包括:语音水印值;将所述语音水印值对应的语音水印所在的语音帧的尾点确定为唤醒时间点。3.根据权利要求1所述的方法,其中,所述端点包括声纹判定起点和声纹判定尾点,所述预设标识为预设空包,且所述预设空包添加在所述声纹判定尾点之后,所述将所述包含预设标识的语音识别信号,发送至服务端,包括:将所述语音识别信号划分为语音包,并从所述声纹判定起点开始,将所述语音包和所述预设空包发送至服务端。4.根据权利要求3所述的方法,其中,所述语音识别信号对应的语音包包含第一类型标识,所述预设空包包含第二类型标识,所述第一类型标识和所述第二类型标识不同。5.根据权利要求1

4任一项所述的方法,其中,还包括:采集包含所述预设内容的注册语音信号;将所述注册语音信号发送至所述服务端,以使所述服务端基于所述注册语音信号建立所述声纹模型。6.一种声纹判定装置,包括:添加模块,用于在语音识别信号中添加预设标识,以得到包含预设标识的语音识别信号,所述语音识别信号包括声纹判定部分,所述预设标识用于在所述语音识别信号中确定所述声纹判定部分,所述声纹判定部分包括预设内容;发送模块,用于将所述包含预设标识的语音识别信号,发送至服务端,以使所述服务端基于...

【专利技术属性】
技术研发人员:孙洪菠
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1