一种基于声纹锁的电视智能遥控装置制造方法及图纸

技术编号:20653482 阅读:23 留言:0更新日期:2019-03-23 05:57
本实用新型专利技术提供了一种基于声纹锁的电视智能遥控装置,包括话筒,用于接收语音片段输入;音频编解码芯片,与所述话筒连接,将语音片段数字化以提供数字语音信号;语音预处理模块,接收所述数字语音信号并对数字语音信号进行预处理,所述预处理包括预加重、分帧、加窗和端点检测;提取特征参数模块,对经过预处理的数字语音提取特征参数,所述特征参数为12维美尔频率倒谱系数;语音识别模型,接收特征参数,并将特征参数与语音识别模型的中语音指令进行匹配,若匹配成功,则根据所述语音特征参数向处理器输出识别指令,若匹配不成功,则语音识别模型不输出任何指令;处理器,执行所述语音识别模型输出的指令。

【技术实现步骤摘要】
一种基于声纹锁的电视智能遥控装置
本技术属于电视智能控制
,更具体涉及一种基于声纹锁的电视遥控装置及其工作方法。
技术介绍
随着智能技术的飞速发展,智能电视已经开始进入千家万户。每个人的喜好不一样,所以人们对电视的个性化需求越来越强烈。传统的电视机遥控器由于体积较小,易于遗失;并且人们在做其他的事情时,则无法完成对电视机的遥控。随着声纹识别技术的逐渐成熟,可以帮助人们解决这一难题。
技术实现思路
本技术的目的是提供一种智能操作且能够满足人们个性化需求的基于声纹锁的电视遥控装置及其工作方法。根据本技术的一个方面,提供了一种基于声纹锁的电视智能遥控装置,其特征在于,包括话筒,用于接收语音片段输入;音频编解码芯片,分别与所述话筒连接,将语音片段数字化以提供数字语音信号;语音预处理模块,接收所述数字语音信号并对数字语音信号进行预处理,所述预处理包括预加重、分帧、加窗和端点检测;提取特征参数模块,对经过预处理的数字语音提取特征参数,所述特征参数为12维美尔频率倒谱系数;语音识别模型,接收特征参数,并将特征参数与语音识别模型的中语音指令进行匹配,若匹配成功,则根据所述语音特征参数向处理器输出识别指令,若匹配不成功,则语音识别模型不输出任何指令;处理器,执行所述语音识别模型输出的指令。在一些实施方式中,还包括红外发送模块,所述红外发送模块与所述处理器连接,用于处理器对外交换信息。在一些实施方式中,还包括蜂鸣器,所述蜂鸣器与所述处理器连接。在一些实施方式中,语音预处理模块、提取特征参数模块和语音识别模型储存在NAND闪存中。在一些实施方式中,还包括RTC定时器,所述RTC定时器与所述处理器连接,用于限定电视机的开机时长;在一些实施方式中,还包括键盘,所述键盘与所述处理器连接,并通过键盘输入指令的不同决定处理器进入训练模式或工作模式,并通过键盘设定开机时间。其有益效果为:本技术通过采集语音信息来同时进行说话人身份识别,可以在用户长期离家时实时采集声音是否为预存在电视里的说话人,如果采集到陌生人的语音信息电视机可可通过联网方式进行报警,一旦被盗会将电视机当前位置信息发送给电视机实际拥有者,使电视机具有防盗功能;本技术通过采集语音信息来同时进行说话人身份识别,电视机可根据说话人不同,推送不同的电视节目,可以实现电视的个性化私人定制;本技术通过采集语音信息来同时进行说话人身份识别和内容识别,可实现家长模式和儿童模式,针对不同的说话人采用不同的电视机控制方式,从而对老人、病人或儿童等家庭特殊成员看电视的时间进行了完全控制,从而有效地解决了儿童看电视时间无法控制的问题,进而对儿童的学习和生活实现良好的引导,使儿童养成良好的学习和娱乐习惯,为儿童的身心健康打下良好的基础。附图说明图1是本技术一种基于声纹锁的电视智能遥控装置的结构示意图;图2是本技术一种基于声纹锁的电视智能遥控装置的工作方法的语音预处理的步骤示意图;图3是本技术一种基于声纹锁的电视智能遥控装置的工作方法的特征参数提取的步骤示意图。具体实施方式下面结合具体实施例对本技术作进一步的说明。如图1所示,一种基于声纹锁的电视遥控装置,包括处理器、话筒、音频编解码芯片、语音预处理模块、语音识别模型、提取特征参数模块、键盘、蜂鸣器和红外发送模块。话筒用于接收语音片段输入。音频编解码芯片与所述话筒连接,将语音片段数字化以提供数字语音信号。语音预处理模块,接收所述数字语音信号并对数字语音信号进行预处理,所述预处理包括预加重、分帧、加窗和端点检测。提取特征参数模块,对经过预处理的数字语音提取特征参数,所述特征参数为12维美尔频率倒谱系数。语音识别模型接收特征参数,并将特征参数与语音识别模型的中语音指令进行匹配,若匹配成功,则根据所述语音特征参数向处理器输出识别指令,若匹配不成功,则语音识别模型不输出任何指令。处理器,执行语音识别模型输出的识别指令。语音预处理模块、提取特征参数模块和语音识别模型均储存在NAND闪存单元中。RTC定时器与所述处理器连接,用于限定电视机的开机时长。键盘与所述处理器连接,并通过键盘输入指令的不同决定处理器进入训练模式或工作模式,并通过键盘设定开机时间。蜂鸣器与处理器连接,当处理器每执行一次指令时,蜂鸣器发出提示音,方便人们的使用。如图2-3所示,一种基于声纹的电视智能遥控装置的工作方法,包括如下步骤:处理器根据键盘的按键输入选择工作模式或训练模式。在该实施例中,若键盘输入为“#”,则处理器进入工作模式,若键盘输入为“*”,则进入训练模式。当处理器进入训练模式时:话筒接收语音片段的输入,并将语音片段输送至音频编码芯片,所述音频编码芯片对语音片段数字化,以提供数字语音信号。语音预处理模块对数字语音信号进行预处理,预处理包括预加重、分帧、加窗和端点检测。特征参数提取模块对经过预处理的数字语音提取语音特征参数,所述语音特征参数为12维美尔频率倒谱系数。通过语音特征参数建立语音识别模型。对说话人识别模型训练采用如下方法:接收各说话人训练语音片段输入;对说话人训练语音片段数字化以提供数字语音信号X(n1),其中n1表示说话人训练数字语音离散点序号;采用上文所述的预处理,对数字语音信号X(n1)进行预处理,包括预加重、分帧、加窗、端点检测,得到说话人训练数字语音信号X(n′1);对经过预处理的数字语音X(n′1)提取语音特征参数,该特征参数为12维美尔频率倒谱系数;利用上述方法提取的语音特征参数来训练说话人识别模型。说话人识别模型的建立方法如下:设置说话人识别模型的的混合高斯模型的阶数为4;用K均值方法(kmeans)初始化说话人识别模型,得到各高斯分布的初始化参数:均值向量μk,协方差矩阵∑k,混合分量权值ck,其表示第k个说话人对应的初始化子模型参数设第c个说话人训练语音的第t个特征参数为其中Tc表示第c个说话人训练语音的帧数,C表示训练样本的总数,按照下面的公式对高斯分布的初始化参数进行重新估计,令其中表示对应的说话人,得到各说话人识别子模型参数:所述说话人识别模型为混合高斯模型,将上面得到的各说话人识别子模型参数代入下面的公式,形成训练好的各说话人识别子模型,这些训练好的子模型集合即为最终说话人识别模型:所述该高斯混合模型用4个单高斯分布的线性组合来描述帧特征在特征空间中的分布,具体描述如下:其中其中,D为特征维数,此处D=12,bk(x)称为核函数,是均值向量为协方差矩阵为的高斯分布函数,高斯混合分布的加权系数满足:说话人识别混合高斯模型参数集λ1就是由上述的各均值分量、协方差矩阵及混合分量的权值组成,表示成如下三元组的形式:对说话人指令识别模型的建立方法如下:接收1个说话人指令训练语音片段输入;对指令训练语音片段数字化以提供数字语音信号X(n2),其中n2表示指令训练数字语音离散点序号;采用上文所述的预处理,对指令训练数字语音信号X(n)进行处理,得到指令训练数字语音信号X(n′2);对经过预处理的数字语音提取语音特征参数,该特征参数为12维美尔频率倒谱系数。利用提取的语音指令特征参数来训练语音指令模型的方法如下:设置语音指令识别模型的的混合高斯模型的阶数为10;用K均值方法kmeans初始化语音指令识本文档来自技高网...

【技术保护点】
1.一种基于声纹锁的电视智能遥控装置,其特征在于,包括话筒,用于接收语音片段输入;音频编解码芯片,与所述话筒连接,将语音片段数字化以提供数字语音信号;语音预处理模块,接收所述数字语音信号并对数字语音信号进行预处理,所述预处理包括预加重、分帧、加窗和端点检测;提取特征参数模块,对经过预处理的数字语音提取特征参数,所述特征参数为12维美尔频率倒谱系数;语音识别模型,接收特征参数,并将特征参数与语音识别模型的中语音指令进行匹配,匹配的过程包括通过采集语音信息来同时进行说话人身份识别,在用户长期离家时实时采集声音是否为预存在电视里的说话人,如果采集到陌生人的语音信息电视机可通过联网方式进行报警;通过采集语音信息来同时进行说话人身份识别,电视机可根据说话人不同,推送不同的电视节目;通过采集语音信息来同时进行说话人身份识别和内容识别,可实现家长模式和儿童模式,针对不同的说话人采用不同的电视机控制方式,若匹配成功,则根据语音特征参数向处理器输出识别指令,若匹配不成功,则语音识别模型不输出任何指令;处理器,执行所述语音识别模型输出的指令;还包括红外发送模块,所述红外发送模块与所述处理器连接,用于处理器对外交换信息;还包括蜂鸣器,所述蜂鸣器与所述处理器连接;语音预处理模块、提取特征参数模块和语音识别模型储存在NAND闪存中;还包括RTC定时器,所述RTC定时器与所述处理器连接,用于限定电视机的开机时长;还包括键盘,所述键盘与所述处理器连接,并通过键盘输入指令的不同决定处理器进入训练模式或工作模式,并通过键盘设定开机时间。...

【技术特征摘要】
1.一种基于声纹锁的电视智能遥控装置,其特征在于,包括话筒,用于接收语音片段输入;音频编解码芯片,与所述话筒连接,将语音片段数字化以提供数字语音信号;语音预处理模块,接收所述数字语音信号并对数字语音信号进行预处理,所述预处理包括预加重、分帧、加窗和端点检测;提取特征参数模块,对经过预处理的数字语音提取特征参数,所述特征参数为12维美尔频率倒谱系数;语音识别模型,接收特征参数,并将特征参数与语音识别模型的中语音指令进行匹配,匹配的过程包括通过采集语音信息来同时进行说话人身份识别,在用户长期离家时实时采集声音是否为预存在电视里的说话人,如果采集到陌生人的语音信息电视机可通过联网方式进行报警;通过采集语音信息来同时进行说话人身份识别,电视机可根据说话人不同,推...

【专利技术属性】
技术研发人员:陈劲松高京标黄永明王桂富
申请(专利权)人:江苏大丰和顺电子有限公司
类型:新型
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1