一种语音识别方法及装置制造方法及图纸

技术编号：11827794 阅读：96 留言：0更新日期：2015-08-05 11:03

本发明专利技术的实施例提供一种语音识别方法及装置，涉及电子技术领域，可提高语音识别的准确性。该方案包括：接收任意用户发出的第一语音信号；对所述第一语音信号进行模数转换，生成模数转换后的第一数字信号；从所述第一数字信号中提取第一语音参数，所述第一语音参数至少包括所述第一语音信号的基频信息、声压信息以及频谱信息中的任一个；若所述第一语音参数与采样库中的第一预存语音参数相符，则执行所述第一数字信号所指示的控制信令，所述采样库中预先存储有N个用户的语音参数，N≥1。该方案可应用于语音识别过程中。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音识别方法及装置
本专利技术涉及电子
，尤其涉及一种语音识别方法及装置。
技术介绍
语音识别技术是让机器通过识别和理解，把语音信号转变为相应的文本或命令的技术。例如，拥有语音识别功能的手机接收到用户的语音指令后，对该语音指令进行模数转换得到相应的数字信号，进而根据转换后的数字信号识别该语音指令的内容，例如，该语音指令的内容为“解锁”，那么，手机根据该语音指令的内容生成用于解锁的控制信令，以便于对手机进行解锁操作。然而，在上述语音识别过程中，只能识别接收到的语音指令的内容，但无法确定该语音指令的执行主体，这样就会降低语音识别的准确性，甚至带来不必要的误操作风险，例如，任意用户施加“解锁”指令的语音信号都可以对手机解锁，给用户的信息造成安全隐患。
技术实现思路
本专利技术的实施例提供一种语音识别方法及装置，可提高语音识别的准确性。为达到上述目的，本专利技术的实施例采用如下技术方案：第一方面，本专利技术的实施例提供一种语音识别方法，包括：接收任意用户发出的第一语音信号；对所述第一语音信号进行模数转换，生成模数转换后的第一数字信号；从所述第一数字信号中提取第一语音参数，所述第一语音参数至少包括所述第一语音信号的基频信息、声压信息以及频谱信息中的任一个；若所述第一语音参数与采样库中的第一预存语音参数相符，则执行所述第一数字信号所指示的控制信令，所述采样库中预先存储有N个用户的语音参数，N≥1。结合第一方面，在第一方面的第一种可能的实现方式中，在从所述第一数字信号中提取第一语音参数之后，还包括：若所述第一语音参数与所述采样库中的所述N个用户的语音参数均不相符，...
一种语音识别方法及装置

【技术保护点】
一种语音识别方法，其特征在于，包括：接收任意用户发出的第一语音信号；对所述第一语音信号进行模数转换，生成模数转换后的第一数字信号；从所述第一数字信号中提取第一语音参数，所述第一语音参数包括所述第一语音信号的基频信息、声压信息以及频谱信息中的至少一个；若所述第一语音参数与采样库中的第一预存语音参数相符，则执行所述第一数字信号所指示的控制信令，所述采样库中预先存储有N个用户的语音参数，N≥1。

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：接收任意用户发出的第一语音信号；对所述第一语音信号进行模数转换，生成模数转换后的第一数字信号；从所述第一数字信号中提取第一语音参数，所述第一语音参数包括所述第一语音信号的基频信息、声压信息以及频谱信息中的至少一个；若所述第一语音参数与采样库中的第一预存语音参数相符，则执行所述第一数字信号所指示的控制信令，所述采样库中预先存储有N个用户的语音参数，N≥1；其中，从所述第一数字信号中提取第一语音参数，包括：对所述第一数字信号进行信号过滤，以使得过滤后的第一数字信号中至少包括第一子信号和第二子信号；从所述第一子信号中提取第二语音参数，并从所述第二子信号中提取第三语音参数，所述第二语音参数包括所述第一子信号的基频信息、声压信息以及频谱信息中的至少一个，所述第三语音参数包括所述第二子信号的基频信息、声压信息以及频谱信息中的至少一个。2.根据权利要求1所述的方法，其特征在于，在从所述第一数字信号中提取第一语音参数之后，还包括：若所述第一语音参数与所述采样库中的所述N个用户的语音参数均不相符，则将第一语音信号标记为陌生人语音。3.根据权利要求1所述的方法，其特征在于，若所述第一语音参数与采样库中的第一预存语音参数相符，则执行所述第一数字信号所指示的控制信令，包括：若所述第一语音参数与所述第一预存语音参数的相似度大于阈值，则确定发送所述第一语音信号的用户为第一用户；若所述第一用户具有语音权限，则执行所述第一数字信号所指示的控制信令。4.根据权利要求1所述的方法，其特征在于，若所述第一语音参数与采样库中的第一预存语音参数相符，则执行所述第一数字信号所指示的控制信令，包括：确定所述采样库中是否包括有与所述第二语音参数相符的第二预存语音参数，和/或，与所述第三语音参数相符的第三预存语音参数；若所述采样库中有与所述第二语音参数相符的第二预存语音参数，则执行所述第一子信号所指示的控制信令；和/或，若所述采样库中有与所述第三语音参数相符的第三预存语音参数，则执行所述第二子信号所指示的控制信令。5.根据权利要求1所述的方法，其特征在于，在接收任意用户发出的第一语音信号之前，还包括：将所述第一预存语音参数和所述第一预存语音参数所对应的第一用户的标识存储至所述采样库，以建立所述第一用户与所述第一预存语音参数...

【专利技术属性】
技术研发人员：吕本登，
申请(专利权)人：北京京东方多媒体科技有限公司，京东方科技集团股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人