一种语音控制家庭智能终端的系统技术方案

技术编号:15692537 阅读:178 留言:0更新日期:2017-06-24 06:38
本发明专利技术公开了一种语音控制家庭智能终端的系统,包括语音数据单元、预处理单元、提取特征参数单元、VQ模型训练单元、VQ码本匹配计算单元、码本库单元、识别输出单元;所述语音数据单元输出数据到预处理单元;所述预处理单元输出数据到提取特征参数单元。本发明专利技术通过语音实现家庭智能终端控制的方法使智能家居交互体验更好,个性化场景设定来满足家庭每个人的特定需求,通过识别各自语音来进行家庭智能端物联网平台上的产品实现有效联动,通过语音控制,采用手机依赖,提高其操控体验。

System for controlling home intelligent terminal by voice

The invention discloses a voice control system of family intelligent terminal, including voice data unit, preprocessing unit, feature extraction unit, VQ unit, VQ model training codebook matching calculation unit, the base unit, the identification code output unit; the voice data unit to output data preprocessing unit; the pre the processing unit outputs the data to the feature extraction unit. The method of the invention realizes the family intelligent control terminal through the voice of the intelligent Home Furnishing interactive experience better, personalized settings to meet the specific needs of each family, to the family of intelligent networking platform on the end of their voice recognition products through effective linkage, through voice control, using mobile phone dependence, improve the control experience.

【技术实现步骤摘要】
一种语音控制家庭智能终端的系统
本专利技术涉及智能家居,具体涉及一种语音控制家庭智能终端的系统。
技术介绍
现在技术大部分是通过手机APP手动操作,选择产品联动,通过手机上的产品APP手动操作,体验交互不佳,步骤繁琐而不高效。
技术实现思路
本专利技术的目的是通过识别各自语音来进行家庭智能端物联网平台上的产品实现有效联动,给具体发送需求的人就行,精准操控,提高其操控体验,提供一种语音控制家庭智能终端的系统。本专利技术采用的技术方案是:一种语音控制家庭智能终端的系统,包括语音数据单元、预处理单元、提取特征参数单元、VQ模型训练单元、VQ码本匹配计算单元、码本库单元、识别输出单元;所述语音数据单元输出数据到预处理单元;所述预处理单元输出数据到提取特征参数单元;在训练阶段,对每一个说话者的语音信息通过语音数据单元和预处理单元提取语音数据特征参数,所提取的语音数据特征参数进行分类,通过VQ模型训练单元产生不同码字所组成的码本;在识别或匹配阶段,通过VQ码本匹配计算单元,根据码本库单元的信息,用VQ方法计算平均失真测度,判断说话的人;其中的矢量量化起着双重作用。进一步地,所述语音控制家庭智能终端的系统通过语音实现家庭智能终端控制的方法包括以下步骤:S1,在家庭智能物联网端通过语音设定自己个性化设备联动及智能场景;S2,平台端根据语音识别或暗号来具体细分每一个使用者的设定及信息指令;S3,使用者发送具体指令,平台端识别其语音;S4,根据语音对比,确定具体发送信息者,来反馈具体信息给设备,执行其特定个性化场景。更进一步地,所述步骤S1还包括特征参数的提取、用矢量量化聚类法生成码本及VQ的说话人识别。更进一步地,所述的特征参数的提取具体为采用NFCC的方法来提取,具体提取过程如下:S11,对输入的语音信号进行分帧、加窗,然后作离散傅立叶变换,获得频谱分布信息:设语音信号的DFT为:其中式中x(n)为输入的语音信号,N表示傅立叶变换的点数;S12,再求频谱幅度的平方,得到能量谱;S13,将能量谱通过一组Mel尺度的三角形滤波器组:定义一个有M个滤波器的滤波器组,采用的滤波器为三角滤波器,中心频率为f(m),m=1,2,3,···,M本系统取M=100;S14,计算每个滤波器组输出的对数能量:0≤m≤M-1其中mH(k)为三角滤波器的频率响应;S15,经过离散弦变换DCT得到MFCC系数:0≤n≤N-1MFCC系数个数通常取20—30,本系统选取20阶倒谱系数。更进一步地,所述的用矢量量化聚类法生成码是将每个待识的说话人看作是一个信源,用一个码本来表征;码本是从该说话人的训练序列中提取的MFCC特征矢量聚类而生成;只要训练的序列足够长,认为这个码本有效地包含了说话人的个人特征,而与讲话的内容无关;本系统采用基于分裂的LBG的算法设计VQ码本,Xk(k=1,2,…,K)为训练序列,B为码本;具体实现过程如下:S21,取提取出来的所有帧的特征矢量的型心作为第一个码字矢量B1;S22,将当前的码本Bm根据以下规则分裂,形成2m个码字;其中m从1变化到当前的码本的码字数,ε是分裂时的参数,此处取ε=0.01;S23,根据得到的码本把所有的训练序列(特征矢量)进行分类,然后按照下面两个公式计算训练矢量量化失真量的总和D[n]以及相对失真(n为迭代次数,初始n=0,D[-1]=∞,B为当前的码书),若相对失真小于某一阈值ε,迭代结束,当前的码书就是设计好的2m个码字的码书,转到相对失真计算;否则,转下一步;量化失真量和:相对失真:S24,重新计算各个区域的新型心,得到新的码书,转步骤S23;S25,重复S22,S23和S24步骤,直到形成有M个码字的码书,其中D0=10000。更进一步地,所述VQ的说话人识别具体为:设未知的说话人的特征矢量{X1,...,XT},共有T帧是训练阶段形成的码书,表示码书第m个码字,每一个码书有M个码字;再计算测试者的平均量化失真D,并设置一个阈值,若D小于此阈值,则是原训练者,反之则认为不是原训练者;本专利技术的优点:本专利技术通过语音实现家庭智能终端控制的方法使智能家居交互体验更好,个性化场景设定来满足家庭每个人的特定需求,通过识别各自语音来进行家庭智能端物联网平台上的产品实现有效联动,通过语音控制,采用手机依赖,提高其操控体验。除了上面所描述的目的、特征和优点之外,本专利技术还有其它的目的、特征和优点。下面将参照图,对本专利技术作进一步详细的说明。附图说明构成本申请的一部分的附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。图1是本专利技术的一种语音控制家庭智能终端的系统结构框图;图2是本专利技术的一种语音控制家庭智能终端的系统的控制方法流程图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。参考图1,如图1所示的一种语音控制家庭智能终端的系统,包括语音数据单元、预处理单元、提取特征参数单元、VQ模型训练单元、VQ码本匹配计算单元、码本库单元、识别输出单元;所述语音数据单元输出数据到预处理单元;所述预处理单元输出数据到提取特征参数单元;在训练阶段,对每一个说话者的语音信息通过语音数据单元和预处理单元提取语音数据特征参数,所提取的语音数据特征参数进行分类,通过VQ模型训练单元产生不同码字所组成的码本;在识别或匹配阶段,通过VQ码本匹配计算单元,根据码本库单元的信息,用VQ方法计算平均失真测度(本系统在计算距离d时,采用欧氏距离测度),判断说话的人;其中的矢量量化起着双重作用。所述语音控制家庭智能终端的系统通过语音实现家庭智能终端控制的方法包括以下步骤:S1,在家庭智能物联网端通过语音设定自己个性化设备联动及智能场景;S2,平台端根据语音识别或暗号来具体细分每一个使用者的设定及信息指令;S3,使用者发送具体指令,平台端识别其语音;S4,根据语音对比,确定具体发送信息者,来反馈具体信息给设备,执行其特定个性化场景。所述步骤S1还包括特征参数的提取、用矢量量化聚类法生成码本及VQ的说话人识别。所述的特征参数的提取具体为采用NFCC的方法来提取,具体提取过程如下:S11,对输入的语音信号进行分帧、加窗,然后作离散傅立叶变换,获得频谱分布信息:设语音信号的DFT为:其中式中x(n)为输入的语音信号,N表示傅立叶变换的点数;S12,再求频谱幅度的平方,得到能量谱;S13,将能量谱通过一组Mel尺度的三角形滤波器组:定义一个有M个滤波器的滤波器组(滤波器的个数和临界带的个数相近),采用的滤波器为三角滤波器,中心频率为f(m),m=1,2,3,···,M本系统取M=100;S14,计算每个滤波器组输出的对数能量:0≤m≤M-1其中mH(k)为三角滤波器的频率响应;S15,经过离散弦变换DCT得到MFCC系数:0≤n≤N-1MFCC系数个数通常取20—30,常常不用0阶倒谱系数,因为它反映的是频谱能量,故在一般识别系统中,将称为能量系数,并不作为倒谱系数,本系统选取20阶倒谱系数。所述的用矢量量化聚类法生成码是将每个待识的说话人看作是一个信源,用一个码本来本文档来自技高网...
一种语音控制家庭智能终端的系统

【技术保护点】
一种语音控制家庭智能终端的系统,其特征在于,包括语音数据单元、预处理单元、提取特征参数单元、VQ模型训练单元、VQ码本匹配计算单元、码本库单元、识别输出单元;所述语音数据单元输出数据到预处理单元;所述预处理单元输出数据到提取特征参数单元;在训练阶段,对每一个说话者的语音信息通过语音数据单元和预处理单元提取语音数据特征参数,所提取的语音数据特征参数进行分类,通过VQ模型训练单元产生不同码字所组成的码本;在识别或匹配阶段,通过VQ码本匹配计算单元,根据码本库单元的信息,用VQ方法计算平均失真测度,判断说话的人;其中的矢量量化起着双重作用。

【技术特征摘要】
1.一种语音控制家庭智能终端的系统,其特征在于,包括语音数据单元、预处理单元、提取特征参数单元、VQ模型训练单元、VQ码本匹配计算单元、码本库单元、识别输出单元;所述语音数据单元输出数据到预处理单元;所述预处理单元输出数据到提取特征参数单元;在训练阶段,对每一个说话者的语音信息通过语音数据单元和预处理单元提取语音数据特征参数,所提取的语音数据特征参数进行分类,通过VQ模型训练单元产生不同码字所组成的码本;在识别或匹配阶段,通过VQ码本匹配计算单元,根据码本库单元的信息,用VQ方法计算平均失真测度,判断说话的人;其中的矢量量化起着双重作用。2.根据权利要求1所述的语音控制家庭智能终端的系统,其特征在于,所述语音控制家庭智能终端的系统通过语音实现家庭智能终端控制的方法包括以下步骤:S1,在家庭智能物联网端通过语音设定自己个性化设备联动及智能场景;S2,平台端根据语音识别或暗号来具体细分每一个使用者的设定及信息指令;S3,使用者发送具体指令,平台端识别其语音;S4,根据语音对比,确定具体发送信息者,来反馈具体信息给设备,执行其特定个性化场景。3.根据权利要求1所述的语音控制家庭智能终端的系统,其特征在于,所述步骤S1还包括特征参数的提取、用矢量量化聚类法生成码本及VQ的说话人识别。4.根据权利要求3所述的语音控制家庭智能终端的系统,其特征在于,所述的特征参数的提取具体为采用NFCC的方法来提取,具体提取过程如下:S11,对输入的语音信号进行分帧、加窗,然后作离散傅立叶变换,获得频谱分布信息:设语音信号的DFT为:其中式中x(n)为输入的语音信号,N表示傅立叶变换的点数;S12,再求频谱幅度的平方,得到能量谱;S13,将能量谱通过一组Mel尺度的三角形滤波器组:定义一个有M个滤波器的滤波器组,采用的滤波器为三角滤波器,中心频率为f(m),m=1,2,3,···,M本系统取M=100;S14,计算每个滤波器组输出的对数能量:0≤m≤M-1其中mH(k)为三角滤波器的频率响应;S15,经过离散弦变换DCT得...

【专利技术属性】
技术研发人员:谢锋
申请(专利权)人:深圳市丰巨泰科电子有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1