一种语音识别方法及装置制造方法及图纸

技术编号:11827794 阅读:96 留言:0更新日期:2015-08-05 11:03
本发明专利技术的实施例提供一种语音识别方法及装置,涉及电子技术领域,可提高语音识别的准确性。该方案包括:接收任意用户发出的第一语音信号;对所述第一语音信号进行模数转换,生成模数转换后的第一数字信号;从所述第一数字信号中提取第一语音参数,所述第一语音参数至少包括所述第一语音信号的基频信息、声压信息以及频谱信息中的任一个;若所述第一语音参数与采样库中的第一预存语音参数相符,则执行所述第一数字信号所指示的控制信令,所述采样库中预先存储有N个用户的语音参数,N≥1。该方案可应用于语音识别过程中。

【技术实现步骤摘要】
一种语音识别方法及装置
本专利技术涉及电子
,尤其涉及一种语音识别方法及装置。
技术介绍
语音识别技术是让机器通过识别和理解,把语音信号转变为相应的文本或命令的技术。例如,拥有语音识别功能的手机接收到用户的语音指令后,对该语音指令进行模数转换得到相应的数字信号,进而根据转换后的数字信号识别该语音指令的内容,例如,该语音指令的内容为“解锁”,那么,手机根据该语音指令的内容生成用于解锁的控制信令,以便于对手机进行解锁操作。然而,在上述语音识别过程中,只能识别接收到的语音指令的内容,但无法确定该语音指令的执行主体,这样就会降低语音识别的准确性,甚至带来不必要的误操作风险,例如,任意用户施加“解锁”指令的语音信号都可以对手机解锁,给用户的信息造成安全隐患。
技术实现思路
本专利技术的实施例提供一种语音识别方法及装置,可提高语音识别的准确性。为达到上述目的,本专利技术的实施例采用如下技术方案:第一方面,本专利技术的实施例提供一种语音识别方法,包括:接收任意用户发出的第一语音信号;对所述第一语音信号进行模数转换,生成模数转换后的第一数字信号;从所述第一数字信号中提取第一语音参数,所述第一语音参数至少包括所述第一语音信号的基频信息、声压信息以及频谱信息中的任一个;若所述第一语音参数与采样库中的第一预存语音参数相符,则执行所述第一数字信号所指示的控制信令,所述采样库中预先存储有N个用户的语音参数,N≥1。结合第一方面,在第一方面的第一种可能的实现方式中,在从所述第一数字信号中提取第一语音参数之后,还包括:若所述第一语音参数与所述采样库中的所述N个用户的语音参数均不相符,则将第一语音信号标记为陌生人语音。结合第一方面,在第一方面的第二种可能的实现方式中,若所述第一语音参数与采样库中的所述第一预存语音参数相符,则执行所述第一数字信号所指示的控制信令,包括:若所述第一语音参数与所述第一预存语音参数的相似度大于阈值,则确定发送所述第一语音信号的用户为所述第一用户;若所述第一用户具有语音权限,则执行所述第一数字信号所指示的控制信令。结合第一方面以及第一方面的第一至第二种可能的实现方式中的任一种可能的实现方式,在第一方面的第三种可能的实现方式中,所述从所述第一数字信号中提取第一语音参数,包括:对所述第一数字信号进行信号过滤,以使得过滤后的第一数字信号中至少包括第一子信号和第二子信号;从所述第一子信号中提取第二语音参数,并从所述第二子信号中提取第三语音参数。结合第一方面的第三种可能的实现方式,在第一方面的第四种可能的实现方式中,若所述第一语音参数与采样库中的第一预存语音参数相符,则执行所述第一数字信号所指示的控制信令,包括:从确定所述采样库中是否包括有与所述第二语音参数相符的第二预存语音参数,和/或,与所述第三语音参数相符的第三预存语音参数;若所述采样库中有与所述第二语音参数相符的第二预存语音参数,则执行所述第一子信号所指示的控制信令;和/或,若所述采样库中有与所述第三语音参数相符的第三预存语音参数,则执行所述第二子信号所指示的控制信令。结合第一方面,在第一方面的第五种可能的实现方式中,在接收任意用户发出的第一语音信号之前,还包括:将所述第一预存语音参数和所述第一预存语音参数所对应的第一用户的标识存储至所述采样库,以建立所述第一用户与所述第一预存语音参数的对应关系。第二方面,本专利技术提供一种语音识别装置,包括:接收单元,用于接收任意用户发出的第一语音信号;采样单元,用于对所述接收单元中的第一语音信号进行模数转换,生成模数转换后的第一数字信号;提取单元,用于从所述采样单元中的第一数字信号中提取第一语音参数,所述第一语音参数至少包括所述第一语音信号的基频信息、声压信息以及频谱信息中的任一个;执行单元,用于若所述提取单元中的第一语音参数与采样库中的第一预存语音参数相符,则执行所述第一数字信号所指示的控制信令,所述采样库中预先存储有N个用户的语音参数,N≥1。结合第二方方面,在第二方面的第一种可能的实现方式中,所述装置还包括标记单元,用于若所述第一语音参数与所述采样库中的所述N个用户的语音参数均不相符,则将第一语音信号标记为陌生人语音。结合第二方方面,在第二方面的第二种可能的实现方式中,所述装置还包括匹配单元,其中,所述匹配单元,用于若所述第一语音参数与所述第一预存语音参数的相似度大于阈值,则确定发送所述第一语音信号的用户为所述第一用户;所述执行单元,具体用于若所述匹配单元中的第一用户具有语音权限,则执行所述第一数字信号所指示的控制信令。结合第二方方面以及第二方面的第一至第二种可能的实现方式中的任一种可能的实现方式,在第二方面的第三种可能的实现方式中,所述装置还包括过滤单元,其中,所述过滤单元,用于对所述第一数字信号进行信号过滤,以使得过滤后的第一数字信号中至少包括第一子信号和第二子信号;所述提取单元,还用于从所述过滤单元中的第一子信号中提取第二语音参数,并从所述过滤单元中的第二子信号中提取第三语音参数;所述匹配单元,还用于确定所述采样库中是否包括有与所述第二语音参数相符的第二预存语音参数,和/或,与所述第三语音参数相符的第三预存语音参数;所述执行单元,还用于若所述采样库中有与所述第二语音参数相符的第二预存语音参数,则执行所述第一子信号所指示的控制信令;和/或,若所述采样库中有与所述第三语音参数相符的第三预存语音参数,则执行所述第二子信号所指示的控制信令。结合第二方方面,在第二方面的第四种可能的实现方式中,所述匹配单元,还用于将所述第一预存语音参数和所述第一预存语音参数所对应的第一用户的标识存储至所述采样库,以建立所述第一用户与所述第一预存语音参数的对应关系。本专利技术的实施例提供一种语音识别方法及装置,通过对获取到的语音信号进行模数转换以生成模数转换后的第一数字信号,进而从第一数字信号中提取第一语音参数(包括第一语音信号的基频信息、声压信息以及频谱信息中的任一个),若第一语音参数与采样库中的第一预存语音参数相符,也就是说第一数字信号与第一用户相匹配,那么,语音识别装置便可以执行第一数字信号所指示的控制信令,这样一来,当语音识别装置获取到与采样库中任意用户的语音参数相符合的数字信号时,便可以确认出该数字信号所对应的语音信号的执行主体,提高了语音识别的准确性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种语音识别方法的流程示意图一;图2为本专利技术实施例提供的一种语音识别方法的流程示意图二;图3为本专利技术实施例提供的一种语音识别装置的结构示意图一;图4为本专利技术实施例提供的一种语音识别装置的结构示意图二;图5为本专利技术实施例提供的一种语音识别装置的结构示意图三;图6为本专利技术实施例提供的一种语音识别装置的结构示意图四;图7为本专利技术实施例提供的一种语音识别装置的硬件示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本专利技术。然而,本领域的技术人员应当清楚本文档来自技高网...
一种语音识别方法及装置

【技术保护点】
一种语音识别方法,其特征在于,包括:接收任意用户发出的第一语音信号;对所述第一语音信号进行模数转换,生成模数转换后的第一数字信号;从所述第一数字信号中提取第一语音参数,所述第一语音参数包括所述第一语音信号的基频信息、声压信息以及频谱信息中的至少一个;若所述第一语音参数与采样库中的第一预存语音参数相符,则执行所述第一数字信号所指示的控制信令,所述采样库中预先存储有N个用户的语音参数,N≥1。

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:接收任意用户发出的第一语音信号;对所述第一语音信号进行模数转换,生成模数转换后的第一数字信号;从所述第一数字信号中提取第一语音参数,所述第一语音参数包括所述第一语音信号的基频信息、声压信息以及频谱信息中的至少一个;若所述第一语音参数与采样库中的第一预存语音参数相符,则执行所述第一数字信号所指示的控制信令,所述采样库中预先存储有N个用户的语音参数,N≥1;其中,从所述第一数字信号中提取第一语音参数,包括:对所述第一数字信号进行信号过滤,以使得过滤后的第一数字信号中至少包括第一子信号和第二子信号;从所述第一子信号中提取第二语音参数,并从所述第二子信号中提取第三语音参数,所述第二语音参数包括所述第一子信号的基频信息、声压信息以及频谱信息中的至少一个,所述第三语音参数包括所述第二子信号的基频信息、声压信息以及频谱信息中的至少一个。2.根据权利要求1所述的方法,其特征在于,在从所述第一数字信号中提取第一语音参数之后,还包括:若所述第一语音参数与所述采样库中的所述N个用户的语音参数均不相符,则将第一语音信号标记为陌生人语音。3.根据权利要求1所述的方法,其特征在于,若所述第一语音参数与采样库中的第一预存语音参数相符,则执行所述第一数字信号所指示的控制信令,包括:若所述第一语音参数与所述第一预存语音参数的相似度大于阈值,则确定发送所述第一语音信号的用户为第一用户;若所述第一用户具有语音权限,则执行所述第一数字信号所指示的控制信令。4.根据权利要求1所述的方法,其特征在于,若所述第一语音参数与采样库中的第一预存语音参数相符,则执行所述第一数字信号所指示的控制信令,包括:确定所述采样库中是否包括有与所述第二语音参数相符的第二预存语音参数,和/或,与所述第三语音参数相符的第三预存语音参数;若所述采样库中有与所述第二语音参数相符的第二预存语音参数,则执行所述第一子信号所指示的控制信令;和/或,若所述采样库中有与所述第三语音参数相符的第三预存语音参数,则执行所述第二子信号所指示的控制信令。5.根据权利要求1所述的方法,其特征在于,在接收任意用户发出的第一语音信号之前,还包括:将所述第一预存语音参数和所述第一预存语音参数所对应的第一用户的标识存储至所述采样库,以建立所述第一用户与所述第一预存语音参数...

【专利技术属性】
技术研发人员:吕本登
申请(专利权)人:北京京东方多媒体科技有限公司京东方科技集团股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1