语音特征提取方法、装置、电子设备和存储介质制造方法及图纸

技术编号：25273976 阅读：33 留言：0更新日期：2020-08-14 23:06

本发明专利技术实施例提供一种语音特征提取方法、装置、电子设备和存储介质，其中方法包括：确定语音数据；将所述语音数据输入至语音特征提取模型中，得到所述语音特征提取模型输出的语音特征；其中，所述语音特征提取模型是基于样本语音数据无监督训练得到的；所述语音提取模型用于将所述语音数据编码得到隐层特征，并将所述隐层特征进行非线性空间映射，得到所述语音特征。本发明专利技术实施例提供的方法、装置、电子设备和存储介质，对语音数据进行编码即可实现针对语音数据的隐层特征的深度挖掘和表达，对隐层特征进行非线性空间映射即可优化语音特征对于语音数据的拟合效果，且节省了大量计算，避免了由于人为降维带来的高维特征损失。

全部详细技术资料下载

【技术实现步骤摘要】
语音特征提取方法、装置、电子设备和存储介质
本专利技术涉及智能语音
，尤其涉及一种语音特征提取方法、装置、电子设备和存储介质。
技术介绍
智能语音技术作为人工智能重要的组成部分，其应用通过标注大量的有监督数据，重新训练语音模型或者在原始语音模型上进行优化，其过程会消耗大量的人力和时间成本。特别地，在一些特殊行业，受限于行业的机密性，无法利用互联网平台进行大规模的标注工作。因此，无监督的语音特征提取方法应用而生。目前无监督的语音特征提取方法主要包括主成分分析方法和基于混合高斯模型的方法两种，上述两种方法的设置前提均是语音数据服从高斯分布，且在执行过程中仅需要进行人为降维，然而语音数据不一定符合高斯分布，且人为降维会无可避免地导致高维特征的损失，这些都导致语音特征的无监督提取偏离真实情况，影响后续语音识别、说话人识别、语种识别等应用的可靠性和准确性。
技术实现思路
本专利技术实施例提供一种语音特征提取方法、装置、电子设备和存储介质，用以解决现有的无监督语音特征提取的准确性和可靠性低的问题。第一方面，本专利技术实施例提供一种语音特征提取方法，包括：确定语音数据；将所述语音数据输入至语音特征提取模型中，得到所述语音特征提取模型输出的语音特征；其中，所述语音特征提取模型是基于样本语音数据无监督训练得到的；所述语音提取模型用于将所述语音数据编码得到隐层特征，并将所述隐层特征进行非线性空间映射，得到所述语音特征。优选地，所述将所述语音数据输入至语音特征提取模...

【技术保护点】
1.一种语音特征提取方法，其特征在于，包括：/n确定语音数据；/n将所述语音数据输入至语音特征提取模型中，得到所述语音特征提取模型输出的语音特征；/n其中，所述语音特征提取模型是基于样本语音数据无监督训练得到的；所述语音提取模型用于将所述语音数据编码得到隐层特征，并将所述隐层特征进行非线性空间映射，得到所述语音特征。/n

【技术特征摘要】
1.一种语音特征提取方法，其特征在于，包括：
确定语音数据；
将所述语音数据输入至语音特征提取模型中，得到所述语音特征提取模型输出的语音特征；
其中，所述语音特征提取模型是基于样本语音数据无监督训练得到的；所述语音提取模型用于将所述语音数据编码得到隐层特征，并将所述隐层特征进行非线性空间映射，得到所述语音特征。

2.根据权利要求1所述的语音特征提取方法，其特征在于，所述将所述语音数据输入至语音特征提取模型中，得到所述语音特征提取模型输出的语音特征，具体包括：
将所述语音数据输入至所述语音特征提取模型的隐层特征提取层，得到所述隐层特征提取层输出的所述隐层特征；
将所述隐层特征输入至所述语音特征提取模型的空间映射层，得到所述空间映射层输出的所述语音特征。

3.根据权利要求1所述的语音特征提取方法，其特征在于，所述语音特征提取模型是基于同一正向语音数据对中两个样本语音数据的样本语音特征之间的相关性，和/或不同正向语音数据对中样本语音数据的样本语音特征之间的差异性训练得到的；
任一正向语音数据对中两个样本语音数据分别为原始语音数据和增强语音数据，所述增强语音数据是对所述原始语音数据进行数据增强得到的。

4.根据权利要求3所述的语音特征提取方法，其特征在于，所述语音特征提取模型的损失函数是基于每一样本语音数据的对内特征相似度和对间特征相似度确定的；
其中，任一样本语音数据的对内特征相似度为所述任一样本语音数据的样本语音特征与所属正向语音数据对中另一样本语音数据的样本语音特征之间的相似度，所述任一样本语音数据的对间特征相似度为所述任一样本语音数据的样本语音特征与所属正向语音数据对之外的每一样本语音数据的样本语音特征之间的相似度。

5.根据...

【专利技术属性】
技术研发人员：杨帆，方磊，方四安，
申请(专利权)人：合肥讯飞数码科技有限公司，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人