基于STO阵列和动态时间规划算法的语音识别方法技术

技术编号:34477344 阅读:29 留言:0更新日期:2022-08-10 08:52
发明专利技术公开了基于STO阵列和动态时间规划算法的语音识别方法。该方法包括利用STO阵列对语音信号的处理以及用改良后的动态时间规划算法进行识别。所述的STO可以在无外加磁场下产生稳定的微波信号。所述方法,首先将信号进行时域预处理,然后进行快速傅立叶变换,再经过计算将功率谱分段转换为电流信号并通入STO阵列,得到各段电流对应的输出频率作为特征矢量。最终利用改良后的动态时间规划算法处理特征矢量,实现识别。该方法利用纳米级的STO器件构造的阵列,结合了STO其可无磁场翻转以及频率的高可调性等特点,并对算法加以改良,对距离限制并且增大训练库,实现语音识别硬件改善系统,有望实现高集成度且高识别率的语音识别。别。别。

【技术实现步骤摘要】
基于STO阵列和动态时间规划算法的语音识别方法


[0001]本专利技术属于语音信号识别
,涉及基于自旋器件的语音信号处理方法,具体涉及基于STO阵列和动态时间规划算法的语音识别方法。

技术介绍

[0002]对于语音识别的研究最早可以追溯到上个世纪中期,当时的贝尔实验室研制出了世界上第一个基于电子计算机的语音识别系统,其系统可以对输入的简单英文发音进行识别,自此,全世界对语音识别的研究进入了飞速发展的时期,有众多语音识别的技术被专利技术出来:八十年代,利用隐马尔可夫模型(HMM)进行语音识别的方式被提出,人工神经网络技术(ANN)也开始被应用到语音识别领域,紧接着出现了动态时间规划(DTW)技术。
[0003]自旋纳米振荡器(STO)是基于STT效应制成的一种纳米级微波振荡器,利用极化电流使自由层中的磁矩发生稳定进动从而产生交变微波信号。关于STO在语音识别领域的应用,已经有研究者提出利用STO与神经网络储层计算结合的方式,可以将STO应用于语音识别,但是该方法的缺点是过于复杂而且实现困难,仅停留在理论阶段,是否可以实现还有待商榷,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于STO阵列和动态时间规划算法的语音识别方法,其特征在于:该方法具体包括以下步骤:步骤1、收集待识别的语音信号,通过预处理滤除噪声后,进行端点检测,输出时域语音信号,对时域语音信号进行快速傅里叶变换后计算频域信号的功率谱;步骤2、将步骤1得到的功率谱按照频率由低到高分成多个频段,再将每个频段下的频率幅度平均值放大相同倍数后作为极化电流值,输入由多个相同的STO组成的STO阵列中,在输出端得到对应的振荡频率;STO阵列中STO的个数大于功率谱被划分的频段数;步骤3、STO阵列输出的振荡频率按功率谱的频段划分顺序排列,得到一个频率向量,计算该频率向量的差分参数,得到待识别语音信号的语音特征矢量{T(1),T(2),T(3),

,T(n),..,T(N)},作为检测模板;步骤4、收集标签已知的语音信号,通过步骤1~3的方法处理后,将得到的每一条已知语音信号的语音特征矢量{R(1),R(2),R(3),

,R(m),..,R(M)}作为匹配模板,保存到匹配数据库中;步骤5、将步骤3得到的检测模板与匹配数据库中保存的匹配模块输入改进的动态时间规划算法中,通过计算两个语音特征矢量间的欧式距离,将距离值最小的匹配模块的标签作为检测模板的识别结果,完成语音识别;所述改进的动态时间规划算法在距离计算的过程中,设定了动态距离的限制范围,当累积距离超出设定范围的终止计算,并将计算结果设置为无穷大。2.如权利要求1所述基于STO阵列和动态时间规划算法的语音识别方法,其特征在于:步骤1中的预处理方法为对信号依次进行预加重、分帧和加窗。3.如权利要求1所述基于STO阵列和动态时间规划算法的语音识别方法,其特征在于:组成...

【专利技术属性】
技术研发人员:崔凯周铁军李海
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1