一种基于声纹识别的冰箱唤醒方法及装置制造方法及图纸

技术编号:20684222 阅读:19 留言:0更新日期:2019-03-27 19:59
本发明专利技术提供了一种基于声纹识别的冰箱唤醒方法及装置,方法包括:采集待验证语音,并获取待验证语音的MFCC声纹特征;根据待验证语音的MFCC声纹特征确定待验证语音的内容;在待验证语音的内容为预置的唤醒词时,将待验证语音的MFCC声纹特征与预先构建的声纹特征库进行比对;在声纹特征库中存在比对结果大于设定的比对门限值的目标声纹特征时,根据第一对应关系、第二对应关系,确定出目标背景主题;唤醒冰箱并点亮显示屏,并在显示屏上展示目标背景主题。本发明专利技术,可以识别待验证语音发起人的身份,并与之匹配与发起人身份对应的背景主题,从而可以提高用户体验。

【技术实现步骤摘要】
一种基于声纹识别的冰箱唤醒方法及装置
本专利技术涉及语音控制
,特别涉及一种基于声纹识别的冰箱唤醒方法及装置。
技术介绍
随着信息技术和人工智能的发展,语音唤醒技术逐渐成为人机交互领域重要的技术之一。其中语音唤醒是指用户通过说出一句预设的唤醒词来实现设备从待机状态恢复到正常工作状态。目前的冰箱所采用的语音唤醒方法,缺少对语音唤醒发起人的身份识别功能,无法识别发起人的身份,进而导致无法进行进一步的权限设置,影响用户体验。
技术实现思路
本专利技术实施例提供了一种基于声纹识别的冰箱唤醒方法及装置,以解决现有技术存在的问题。为实现上述目的,第一方面,本专利技术提供了一种基于声纹识别的冰箱唤醒方法,包括:采集待验证语音,并获取所述待验证语音的MFCC声纹特征;根据所述待验证语音的MFCC声纹特征确定所述待验证语音的内容;在所述待验证语音的内容为预置的唤醒词时,将所述待验证语音的MFCC声纹特征与预先构建的声纹特征库进行比对;在所述声纹特征库中存在比对结果大于设定的比对门限值的目标声纹特征时,根据预先构建的用户ID与声纹特征的第一对应关系,确定与所述目标声纹特征对应的目标用户ID;根据预先构建的用户ID与背景主题的第二对应关系,确定与所述目标用户ID对应的目标背景主题;唤醒所述冰箱并点亮显示屏,并在所述显示屏上展示所述目标背景主题。优选地,进一步包括:获取训练语音,针对所述训练语音提取MFCC声学特征;对提取的MFCC声学特征进行语音活动检测,估计高斯混合模型参数;利用所述高斯混合模型参数对通用背景模型进行训练,建立高斯混合模型-通用背景模型。优选地,所述获取所述待验证语音的MFCC声纹特征,包括:利用所述高斯混合模型-通用背景模型对所述待验证语音进行训练,得到所述待验证语音的MFCC声纹特征;和/或,所述声纹特征库和所述第一对应关系通过以下步骤构建:接收用户发起的声纹注册请求,所述声纹注册请求中包括用户ID和设定条数的注册语音;所述设定条数的注册语音的内容均为所述预置的唤醒词;利用所述高斯混合模型-通用背景模型对所述设定条数的注册语音进行训练,得到该用户的MFCC声纹特征,将该用户的MFCC声纹特征存储到所述声纹特征库中,将该用户ID和该用户的MFCC声纹特征的对应关系存储到所述第一对应关系中。优选地,所述针对所述训练语音提取MFCC声学特征,包括:对所述训练语音进行预加重、分帧和加窗处理,得到训练信号;将所述训练信号进行快速傅里叶变换,得到频域信号;将所述频域信号取模的平方得到离散功率谱,将所述离散功率谱通过一组M个三角带通滤波器滤波,并对每一个三角带通滤波器滤波后的信号取对数后得到M个对数能量,对M个对数能量进行离散余弦变换,得到MFCC声学特征,其中,对M个对数能量通过下述公式进行离散余弦变换:其中,C(n)为MFCC声学特征,L为MFCC系数阶数,s(m)为第m个三角带通滤波器输出的对数能量,M为三角带通滤波器的个数。优选地,所述根据所述待验证语音的MFCC声纹特征确定所述待验证语音的内容,包括:对所述待验证语音的MFCC声纹特征进行识别解码,得到所述待验证语音的内容;对所述待验证语音的内容与预置的唤醒词进行置信度判决,在置信度大于预置的唤醒门限值时,则确定所述待验证语音的内容是所述预置的唤醒词;否则,则确定所述待验证语音的内容不是所述预置的唤醒词。为实现上述目的,第二方面,本专利技术提供了一种基于声纹识别的冰箱唤醒装置,包括:采集单元,用于采集待验证语音;获取单元,用于获取所述待验证语音的MFCC声纹特征;内容确定单元,用于根据所述待验证语音的MFCC声纹特征确定所述待验证语音的内容;比对单元,用于在所述待验证语音的内容为预置的唤醒词时,将所述待验证语音的MFCC声纹特征与预先构建的声纹特征库进行比对;用户ID确定单元,用于在所述声纹特征库中存在比对结果大于设定的比对门限值的目标声纹特征时,根据预先构建的用户ID与声纹特征的第一对应关系,确定与所述目标声纹特征对应的目标用户ID;背景主题确定单元,用于根据预先构建的用户ID与背景主题的第二对应关系,确定与所述目标用户ID对应的目标背景主题;唤醒展示单元,用于唤醒所述冰箱并点亮显示屏,并在所述显示屏上展示所述目标背景主题。优选地,进一步包括:模型构建单元,用于获取训练语音,针对所述训练语音提取MFCC声学特征;对提取的MFCC声学特征进行语音活动检测,估计高斯混合模型参数;利用所述高斯混合模型参数对通用背景模型进行训练,建立高斯混合模型-通用背景模型。优选地,所述获取单元,具体用于利用所述高斯混合模型-通用背景模型对所述待验证语音进行训练,得到所述待验证语音的MFCC声纹特征;和/或,进一步包括:信息构建单元,用于通过以下步骤构建所述声纹特征库和所述第一对应关系:接收用户发起的声纹注册请求,所述声纹注册请求中包括用户ID和设定条数的注册语音;所述设定条数的注册语音的内容均为所述预置的唤醒词;利用所述高斯混合模型-通用背景模型对所述设定条数的注册语音进行训练,得到该用户的MFCC声纹特征,将该用户的MFCC声纹特征存储到所述声纹特征库中,将该用户ID和该用户的MFCC声纹特征的对应关系存储到所述第一对应关系中。优选地,所述模型构建单元,具体用于通过如下步骤实现对所述训练语音提取MFCC声学特征:对所述训练语音进行预加重、分帧和加窗处理,得到训练信号;将所述训练信号进行快速傅里叶变换,得到频域信号;将所述频域信号取模的平方得到离散功率谱,将所述离散功率谱通过一组M个三角带通滤波器滤波,并对每一个三角带通滤波器滤波后的信号取对数后得到M个对数能量,对M个对数能量进行离散余弦变换,得到MFCC声学特征,其中,对M个对数能量通过下述公式进行离散余弦变换:其中,C(n)为MFCC声学特征,L为MFCC系数阶数,s(m)为第m个三角带通滤波器输出的对数能量,M为三角带通滤波器的个数。优选地,所述内容确定单元,具体用于:对所述待验证语音的MFCC声纹特征进行识别解码,得到所述待验证语音的内容;对所述待验证语音的内容与预置的唤醒词进行置信度判决,在置信度大于预置的唤醒门限值时,则确定所述待验证语音的内容是所述预置的唤醒词;否则,则确定所述待验证语音的内容不是所述预置的唤醒词。本专利技术实施例提供了一种基于声纹识别的冰箱唤醒方法及装置,通过获取到待验证语音的MFCC声纹特征,根据MFCC声纹特征确定待验证语音的内容,当待验证语音的内容为预置的唤醒词时,将MFCC声纹特征与声纹特征库进行比对,在声纹特征库中存在比对结果大于设定的比对门限值的目标声纹特征时,根据第一对应关系、第二对应关系,识别出该待验证语音的发起人身份,进而确定出与发起人身份对应的目标背景主题,在唤醒冰箱显示屏之后,在显示屏上展示目标背景主题。本专利技术,可以识别待验证语音发起人的身份,并与之匹配与发起人身份对应的背景主题,从而可以提高用户体验。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施本文档来自技高网...

【技术保护点】
1.一种基于声纹识别的冰箱唤醒方法,其特征在于,包括:采集待验证语音,并获取所述待验证语音的MFCC声纹特征;根据所述待验证语音的MFCC声纹特征确定所述待验证语音的内容;在所述待验证语音的内容为预置的唤醒词时,将所述待验证语音的MFCC声纹特征与预先构建的声纹特征库进行比对;在所述声纹特征库中存在比对结果大于设定的比对门限值的目标声纹特征时,根据预先构建的用户ID与声纹特征的第一对应关系,确定与所述目标声纹特征对应的目标用户ID;根据预先构建的用户ID与背景主题的第二对应关系,确定与所述目标用户ID对应的目标背景主题;唤醒所述冰箱并点亮显示屏,并在所述显示屏上展示所述目标背景主题。

【技术特征摘要】
1.一种基于声纹识别的冰箱唤醒方法,其特征在于,包括:采集待验证语音,并获取所述待验证语音的MFCC声纹特征;根据所述待验证语音的MFCC声纹特征确定所述待验证语音的内容;在所述待验证语音的内容为预置的唤醒词时,将所述待验证语音的MFCC声纹特征与预先构建的声纹特征库进行比对;在所述声纹特征库中存在比对结果大于设定的比对门限值的目标声纹特征时,根据预先构建的用户ID与声纹特征的第一对应关系,确定与所述目标声纹特征对应的目标用户ID;根据预先构建的用户ID与背景主题的第二对应关系,确定与所述目标用户ID对应的目标背景主题;唤醒所述冰箱并点亮显示屏,并在所述显示屏上展示所述目标背景主题。2.根据权利要求1所述的基于声纹识别的冰箱唤醒方法,其特征在于,进一步包括:获取训练语音,针对所述训练语音提取MFCC声学特征;对提取的MFCC声学特征进行语音活动检测,估计高斯混合模型参数;利用所述高斯混合模型参数对通用背景模型进行训练,建立高斯混合模型-通用背景模型。3.根据权利要求2所述的基于声纹识别的冰箱唤醒方法,其特征在于,所述获取所述待验证语音的MFCC声纹特征,包括:利用所述高斯混合模型-通用背景模型对所述待验证语音进行训练,得到所述待验证语音的MFCC声纹特征;和/或,所述声纹特征库和所述第一对应关系通过以下步骤构建:接收用户发起的声纹注册请求,所述声纹注册请求中包括用户ID和设定条数的注册语音;所述设定条数的注册语音的内容均为所述预置的唤醒词;利用所述高斯混合模型-通用背景模型对所述设定条数的注册语音进行训练,得到该用户的MFCC声纹特征,将该用户的MFCC声纹特征存储到所述声纹特征库中,将该用户ID和该用户的MFCC声纹特征的对应关系存储到所述第一对应关系中。4.根据权利要求2所述的基于声纹识别的冰箱唤醒方法,其特征在于,所述针对所述训练语音提取MFCC声学特征,包括:对所述训练语音进行预加重、分帧和加窗处理,得到训练信号;将所述训练信号进行快速傅里叶变换,得到频域信号;将所述频域信号取模的平方得到离散功率谱,将所述离散功率谱通过一组M个三角带通滤波器滤波,并对每一个三角带通滤波器滤波后的信号取对数后得到M个对数能量,对M个对数能量进行离散余弦变换,得到MFCC声学特征,其中,对M个对数能量通过下述公式进行离散余弦变换:其中,C(n)为MFCC声学特征,L为MFCC系数阶数,s(m)为第m个三角带通滤波器输出的对数能量,M为三角带通滤波器的个数。5.根据权利要求1-4中任一所述的基于声纹识别的冰箱唤醒方法,其特征在于,所述根据所述待验证语音的MFCC声纹特征确定所述待验证语音的内容,包括:对所述待验证语音的MFCC声纹特征进行识别解码,得到所述待验证语音的内容;对所述待验证语音的内容与预置的唤醒词进行置信度判决,在置信度大于预置的唤醒门限值时,则确定所述待验证语音的内容是所述预置的唤醒词;否则,则确定所述待验证语音的内容不是所述预置的唤醒词。6.一种基于声纹识别的冰箱唤醒装置,其特征在于,包括:采集单元,...

【专利技术属性】
技术研发人员:文俊李昱兵
申请(专利权)人:四川虹美智能科技有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1