一种智能语音识别方法技术

技术编号：18765498 阅读：253 留言：0更新日期：2018-08-25 11:27

本发明专利技术提供了一种智能语音识别方法，该方法包括：步骤1：将短时功率和ZCR作特征区分静音和语音，进行端点检测；步骤2：将端点检测后的语音信号分割为多个等长帧；步骤3：通过音频功率的动态变化得到语音信号特征；步骤4：基于语音信号特征的比较结果进行智能POS机的用户身份认证。本发明专利技术提出了一种智能语音识别方法，实现了智能POS机终端身份认证数据本地存储、比对和运算，不需要配置硬件密码设备，也无需上传至支付平台，更具安全性。

全部详细技术资料下载

【技术实现步骤摘要】
一种智能语音识别方法
本专利技术涉及语音识别，特别涉及一种智能语音识别方法。
技术介绍
目前销售终端的网络安全特别是智能POS机的安全性令人瞩目，通过智能POS机进行信息传递的安全问题日益受到人们的重视。在当前的智能POS机应用中，都是采用用户名、口令的用户认证，并且对智能POS机用户下发数字证书，并利用硬件密码终端私钥不可导出性，加强用户的身份安全。但任何形态的硬件密码设备都需在智能POS机外接实体设备，更降低了方案的易用性，增加了用户的操作复杂度。对于现有技术的指纹识别，识别信息需要传输，安全性受到挑战。如果支付平台存储的特征库发生损失，则无法进行身份认证。
技术实现思路
为解决上述现有技术所存在的问题，本专利技术提出了一种智能语音识别方法，包括：步骤1：将短时功率和ZCR作特征区分静音和语音，进行端点检测；步骤2：将端点检测后的语音信号分割为多个等长帧；步骤3：通过音频功率的动态变化得到语音信号特征；步骤4：基于语音信号特征的比较结果进行智能POS机的用户身份认证。优选地，所述端点检测进一步包括：检测前，先为短时功率和ZCR确定门限，然后连续计算短时功率及ZCR，调整门限，通过状态分析以判断静音段是否结束。优选地，在端点检测中，将频带划分成4段，按照下式计算子带的功率比率SE：其中：Ui和Li分别表示子带i的上限频率和下限频率，i＝1，2，3，4；X(ω)表示信号在频率ω处的幅值；如果某帧信号的功率ZCR低于门限，且4段子带的SE近似相等，则判断是静音段。优选地，所述步骤2进一步包括：将语音信号分割为R个等长非重叠帧，记为fk＝{fk(n)|n＝1，2，...

【技术保护点】
1.一种智能语音识别方法，其特征在于，包括：步骤1：将短时功率和ZCR作特征区分静音和语音，进行端点检测；步骤2：将端点检测后的语音信号分割为多个等长帧；步骤3：通过音频功率的动态变化得到语音信号特征；步骤4：基于语音信号特征的比较结果进行智能POS机的用户身份认证。

【技术特征摘要】
1.一种智能语音识别方法，其特征在于，包括：步骤1：将短时功率和ZCR作特征区分静音和语音，进行端点检测；步骤2：将端点检测后的语音信号分割为多个等长帧；步骤3：通过音频功率的动态变化得到语音信号特征；步骤4：基于语音信号特征的比较结果进行智能POS机的用户身份认证。2.根据权利要求1所述的方法，其特征在于，所述端点检测进一步包括：检测前，先为短时功率和ZCR确定门限，然后连续计算短时功率及ZCR，调整门限，通过状态分析以判断静音段是否结束。3.根据权利要求2所述的方法，其特征在于：在端点检测中，将频带划分成4段，按照下式计算子带的功率比率SE：其中：Ui和Li分别表示子带i的上限频率和下限频率，i＝1，2，3，4；X(ω)表示信号在频率ω处的幅值；如果某帧信号的功率ZCR低于门限，且4段子带的SE近似相等，则判断是静音段。4.根据权利要求1所述的方法，其特征在于，所述步骤2进一步包括：将语音信号分割...

【专利技术属性】
技术研发人员：李仁超，
申请(专利权)人：成都信达智胜科技有限公司，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人