【技术实现步骤摘要】
语音识别方法、装置、存储介质及电子设备
[0001]本申请涉及语音识别
,尤其涉及一种语音识别方法、装置、存储介质及电子设备。
技术介绍
[0002]随着科技的飞速发展,人机交互技术已成为当前计算机科学领域十分活跃的研究课题。
[0003]语音识别可以有效增强人机交互过程的智能化程度,对人机交互具有重要的现实意义,由于语音中包含了语音内容、情感、语气、语义等丰富信息,为了增强语音识别的稳定性和准确性,在语音识别过程中,不仅是单独对语音内容进行识别,而且还要注重对于语音情感的识别。当前的语音情感识别过程中,通常使用神经网络将提取出的语音特征与各情感特征进行比对以得到识别结果,然而,该比对过程需要进行大量复杂的卷积计算,因而会耗费大量时间,导致语音识别的效率较低。
技术实现思路
[0004]本申请提供一种语音识别方法、装置、存储介质及电子设备,能够缓解当前语音识别效率低的技术问题。
[0005]为了解决上述技术问题,本申请提供以下技术方案:
[0006]本申请提供一种语音识别方法,包 ...
【技术保护点】
【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:当识别到待识别语音信号后,对所述待识别语音信号进行特征提取处理得到待识别语音特征;在映射空间中对所述待识别语音特征进行空间映射处理,得到待识别语音特征映射点;其中,所述映射空间内具有至少一个特征分类区域,且特征分类区域内具有对应的参考特征映射点;确定所述待识别语音特征映射点与各参考特征映射点之间的空间距离;根据所述空间距离,确定所述待识别语音信号的识别结果。2.根据权利要求1所述的语音识别方法,其特征在于,在所述当识别到待识别语音信号后,对所述待识别语音信号进行特征提取处理得到待识别语音特征的步骤之前,还包括:获取训练语音信号;对所述训练语音信号进行图像转换处理,得到训练语音图像;其中,所述训练语音图像表征与所述训练语音信号对应的训练语音信息;将所述训练语音图像输入训练后的语音原型网络,以通过所述语音原型网络输出训练语音特征向量,并在所述映射空间对所述训练语音特征向量进行空间映射处理,得到训练语音特征映射点;根据各训练语音特征映射点在所述映射空间内的分布信息,确定所述映射空间内的参考特征映射点。3.根据权利要求2所述的语音识别方法,其特征在于,所述对所述训练语音信号进行图像转换处理,得到训练语音图像的步骤,包括:对所述训练语音信号进行预处理,得到若干训练语音帧;对各训练语音帧进行傅里叶变换处理,得到对应的若干语音幅度谱;对各语音幅度谱进行拼接处理,得到语谱图;将所述语谱图作为所述训练语音图像。4.根据权利要求2所述的语音识别方法,其特征在于,所述根据各训练语音特征映射点在所述映射空间内的分布信息,确定所述映射空间内的参考特征映射点的步骤,包括:根据各训练语音特征映射点在所述映射空间内的分布信息,确定各训练语音特征映射点所在的特征分类区域;根据各训练语音特征映射点在对应的所述特征分类区域内的分布信息,确定各特征分类区域内的参考特征映射点。5.根据权利要求4所述的语音识别...
【专利技术属性】
技术研发人员:请求不公布姓名,
申请(专利权)人:深圳TCL新技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。