一种声纹识别性能提升方法、装置、终端及存储介质制造方法及图纸

技术编号:16530365 阅读:22 留言:0更新日期:2017-11-09 22:31
本发明专利技术公开了一种声纹识别性能提升方法、装置、终端及存储介质,其中,该方法包括:获取用户输入的语音开启指令;确定所述语音开启指令与预设的引导文本是否匹配;若匹配,则提取所述语音开启指令对应的声纹特征;将提取的所述声纹特征与预先确定的样本声纹特征进行匹配,若匹配成功,则执行开启操作,其中所述样本声纹特征是从语义为所述引导文本的语音信息中预先提取的。本发明专利技术通过获取用户的个性化语音,依据用户的个性化语音信息提取得到用户的样本声纹特征,根据用户的语音开启指令与样本声纹特征的匹配结果执行后续的开启操作。从而不再受语音样本量的限制,提升了容错机制,提高了声纹识别的准确率和用户体验。

【技术实现步骤摘要】
一种声纹识别性能提升方法、装置、终端及存储介质
本专利技术实施例涉及声纹识别
,尤其涉及一种声纹识别性能提升方法、装置、终端及存储介质。
技术介绍
声纹识别技术属于生物识别技术的一种,是一项根据语音中反应说话人生理和行为特征的语音参数来识别语音话者身份的技术。由于每个人的发声器官在尺寸和形态方面不尽相同,因此声纹也就成为一种鉴别说话人身份的识别手段。随着语音识别技术的快速发展,越来越多的智能电器设备采用声纹识别技术来增强用户的用户体验,用户可以根据声纹识别技术锁定个人账户,并对个人账户进行私人属性定义,因此用户可以使用语音快速进入设备系统并获取个人账户信息及功能。因此,声纹识别的准确度十分关键。
技术实现思路
本专利技术实施例提供了一种声纹识别性能提升方法、装置、终端及存储介质,能够增加语音样本量,提高声纹识别的准确性,增强用户体验。第一方面,本专利技术实施例提供了一种声纹识别性能提升方法,包括:获取用户输入的语音开启指令;确定所述语音开启指令与预设的引导文本是否匹配;若匹配,则提取所述语音开启指令对应的声纹特征;将提取的所述声纹特征与预先确定的样本声纹特征进行匹配,若匹配成功,则执行开启操作,其中所述样本声纹特征是从语义为所述引导文本的语音信息中预先提取的。第二方面,本专利技术实施例提供了一种声纹识别性能提升装置,包括:语音指令获取模块,用于获取用户输入的语音开启指令;语音识别模块,用于确定所述语音开启指令与预设的引导文本是否匹配;声纹特征提取模块,用于当所述语音开启指令与预设的引导文本匹配时,提取所述语音开启指令对应的声纹特征;声纹特征匹配模块,用于将提取的所述声纹特征与预先确定的样本声纹特征进行匹配,若匹配成功,则执行开启操作,其中所述样本声纹特征是从语义为所述引导文本的语音信息中预先提取的。第三方面,本专利技术实施例提供了一种终端,包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术任意实施例所述的声纹识别性能提升方法。第四方面,本专利技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本专利技术任意实施例所述的声纹识别性能提升方法。本专利技术实施例提供的一种声纹识别性能提升方法、装置、终端及存储介质,通过获取用户输入的个性化引导语音,依据用户的个性化引导语音提取得到用户的样本声纹特征,并依据样本声纹特征对语音开启指令对应的声纹特征进行匹配。由于引导文本的内容可以由用户自行设定,个性化引导语音提升了容错机制,提高了声纹识别的准确度,从而提高了样本声纹特征的准确度,相应地,提高了后续声纹特征匹配的准确度,提升了用户体验。附图说明图1为本专利技术实施例一提供的一种声纹识别性能提升方法的流程图;图2为本专利技术实施例二提供的一种声纹识别性能提升方法的流程图;图3为本专利技术实施例三提供的一种声纹识别性能提升装置的结构示意图;图4为本专利技术实施例四提供的一种终端的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一提供的一种声纹识别性能提升方法的流程图,本实施例可适用于通过语音指令控制智能设备的情况,该方法可以由声纹识别性能提升装置来执行,该声纹识别性能提升装置可以采用软件和/或硬件的方式实现。参考图1,该方法具体可以包括如下:S110、获取用户输入的语音开启指令。智能终端可以对周围环境进行实时检测,处于休眠状态的智能终端检测到所处环境有语音指令时,获取用户输入的语音开启指令。智能终端是支持语音交互的具有多媒体功能的智能设备,如具有支持音频、视频、数据等方面的功能,可以是智能机器人,智能音箱等。S120、确定语音开启指令与预设的引导文本是否匹配;若匹配,则继续执行S130;否则,跳转执行S160。其中,引导文本是指合法用户预先设置的语音唤醒指令对应的文本,语音唤醒指令用于控制处于休眠状态的智能终端切换到运行状态。例如,在合法用户使用智能终端的过程中例如智能终端首次被使用时,提示用户输入个性化的语音唤醒指令,对语音唤醒指令进行语义分析得到个性化的引导文本。具体的,若语音开启指令与引导文本匹配成功,则当前用户可能是智能终端的合法用户,继续执行后续操作;若语音开启指令与引导文本匹配失败,则当前用户不会是合法用户,可以直接屏蔽该语音开启指令。S130、提取语音开启指令对应的声纹特征。S140、将提取的声纹特征与预先确定的样本声纹特征进行匹配,其中样本声纹特征是从语义为引导文本的语音信息中预先提取的;若匹配成功,则继续执行S150;否则,跳转执行S160。其中,所述样本声纹特征的确定可以包括:在声纹注册过程中,向用户提供录音上传通道;展示个性化语音输入提醒信息;对用户输入的个性化语音内容进行分析,得到所述用户的样本声纹特征。需要说明的是,在声纹注册过程中,对用户输入的个性化语音内容不作具体限定,即对引导文本内容不作具体限定,允许用户使用个性化的引导文本。并且,对个性化语音的数量和音量也不作限定,用户可以不限次数地使用多个惯用音量进行多次引导语音录入。在一定数量范围内,用户在声纹注册过程中输入的个性化语音数量越多,对个性化语音进行分析确定的样本声纹特征的准确度越高。本实施例中样本声纹特征不受语音样本量的限制,提升了容错机制,从而提高了样本声纹特征的准确度。S150、执行开启操作。S160、不进行任何操作。另外需要说明的是,智能终端可以有多个合法用户,不同合法用户对应有样本声纹特征和引导文本,则智能终端中还存储有引导文本与样本声纹特征之间的关联关系,或者存储有合法用户与引导文本,以及合法用户与样本声纹特征之间的映射关系。以智能音箱的开启过程为例,用户A对应的引导文本为“请启动我的智能音箱”,并提取得到用户A的样本声纹特征。用户B所对应的引导文本为“智能音箱快快启动”,并提取得到用户B的样本声纹特征。用户C未对该智能音箱存储任何开启指令、引导文本和样本声纹特征。在智能音箱使用过程中,若用户A对智能音箱说出内容为“请启动我的智能音箱”的语音开启指令,此时语音开启指令与引导文本匹配成功,且“请启动我的智能音箱”对应的当前声纹特征与用户A的样本声纹特征匹配成功,智能音箱启动。然而,当用户A对智能音箱说出内容为“智能音箱快快启动”的语音开启指令时,虽然语音开启指令与用户B的引导文本匹配成功,但是当前声纹特征与用户B的样本声纹特征匹配失败,智能音箱启动失败。本实施例的技术方案,通过获取用户输入的个性化引导语音,依据用户的个性化引导语音提取得到用户的样本声纹特征,并依据样本声纹特征对语音开启指令对应的声纹特征进行匹配。由于引导文本的内容可以由用户自行设定,个性化引导语音提升了容错机制,提高了声纹识别的准确度,从而提高了样本声纹特征的准确度,相应地,提高了后续声纹特征匹配的准确度,提升了用户体验。实施例二本实施例在上述实施例一的基础上,提供了一种样本声纹特征的更新方法。图2为本专利技术实施例二提供的一种声纹识别性能提升方法的流程图,如图2所示,该本文档来自技高网...
一种声纹识别性能提升方法、装置、终端及存储介质

【技术保护点】
一种声纹识别性能提升方法,其特征在于,包括:获取用户输入的语音开启指令;确定所述语音开启指令与预设的引导文本是否匹配;若匹配,则提取所述语音开启指令对应的声纹特征;将提取的所述声纹特征与预先确定的样本声纹特征进行匹配,若匹配成功,则执行开启操作,其中所述样本声纹特征是从语义为所述引导文本的语音信息中预先提取的。

【技术特征摘要】
1.一种声纹识别性能提升方法,其特征在于,包括:获取用户输入的语音开启指令;确定所述语音开启指令与预设的引导文本是否匹配;若匹配,则提取所述语音开启指令对应的声纹特征;将提取的所述声纹特征与预先确定的样本声纹特征进行匹配,若匹配成功,则执行开启操作,其中所述样本声纹特征是从语义为所述引导文本的语音信息中预先提取的。2.根据权利要求1所述的方法,其特征在于,所述样本声纹特征的确定包括:在声纹注册过程中,向用户提供录音上传通道;展示个性化语音输入提醒信息;对用户输入的个性化语音内容进行分析,得到所述用户的样本声纹特征。3.根据权利要求1所述的方法,其特征在于,还包括:在检测到声纹更新事件时,获取用户输入的当前语音信息;对所述当前语音信息进行识别,提取得到当前声纹特征;依据所述当前声纹特征和所述预先确定的样本声纹特征,得到新的样本声纹特征。4.根据权利要求3所述的方法,其特征在于,依据所述当前声纹特征和所述预先确定的样本声纹特征,得到所述新的样本声纹特征,包括:确定所述当前声纹特征和所述预先确定的样本声纹特征所属用户是否相同,若相同,则采用预先确定的系数对所述当前声纹特征和预先确定的样本声纹特征进行融合,得到所述新的样本声纹特征。5.根据权利要求4所述的方法,其特征在于,确定所述当前声纹特征和所述预先确定的样本声纹特征所属用户是否相同,包括:确定所述当前声纹特征和所述预先确定的样本声纹特征之间的相似度,若相似度大于预设的相似度阈值,则确定所述当前声纹特征和所述预先确定的样本声纹特征所属用户相同。6.根据权利要求3所述的方法,其特征在于,在检测到预设的声纹更新按钮被触发,或者检测到样本声纹特征的存在时间长度大于预设的时间长度阈值时,生成所述声纹更新事件。7.一种声纹识别性能提升装置,其特征在于,包括:语音指令获取模块,用于获取用户输入的语音开启指令;语音识别模块,用于确定所述语音开启指令与预设的引导文本是否匹配;声纹特征提取模块,用于当所述语音开启指令与预设的引导文本匹配时,提取所述语音开启指令对应的声纹特征;...

【专利技术属性】
技术研发人员:高聪
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1