语音的处理方法及装置、存储介质、电子设备制造方法及图纸

技术编号：22078636 阅读：28 留言：0更新日期：2019-09-12 15:09

本发明专利技术提供了一种语音的处理方法及装置、存储介质、电子设备，其中，该方法包括：将语音输入预先训练好的音素预测模型，获得所述语音对应的预测音素，计算所述预测音素与所述语音的标准音素之间的音素相似度，基于所述音素相似度确定所述语音是否满足采集要求，可见，对于语音的采集不需要先进行语音识别得到该语音的文本信息，而是通过训练的音素预测模型确定语音是否满足采集要求，从而解决了相关技术中语音样本收集需要先对语音进行语音识别转化为文本信息，由于语音识别不准确，导致语音样本收集效率低、成本高的技术问题，达到了语音样本收集效率高和低成本的效果。

Speech Processing Method and Device, Storage Media and Electronic Equipment

全部详细技术资料下载

【技术实现步骤摘要】
语音的处理方法及装置、存储介质、电子设备
本专利技术涉及计算机
，具体而言，涉及一种语音的处理方法及装置、存储介质、电子设备。
技术介绍
现有技术对语音数据进行采集的时候，需要对被收集语音的质量和内容进行识别判断。确保所收集的语音是有质量的，语音的内容要符合要求。但是，完全绝对的语音音素匹配实际上是不可行的。原因有二，首先，因为我国的地域广大，各地口音众多，完全绝对的语音匹配不能满足同时收集各地口音不一致的语音。其次，我们的收集需求不要求100%完全匹配通过时（如，训练命令词和唤醒词的神经网络）。语音音素完全匹配会损失掉大量的语音样本，造成语音样本收集效率低和增加语音收集的成本。此外，现有技术中公开了一种通过对语音数据进行语音识别得到与语音数据对应的目标文本，再将目标文本与初始语料进行文本相似度匹配，得到目标文本与初始语料之间的文本相似度，进而根据该文本相似度来确定目标文本对应的语音数据是否符合要求。但是，此种方法依赖于语音识别的准确度，当语音识别不准确时（特别是带有口音的语音数据），会造成大量原本合格的语音样本的损失，造成语音样本收集效率低和增加语音收集的成本。针对相关技术中的上述问题，目前尚未存在有效的解决方案。
技术实现思路
本专利技术实施例提供了一种语音的处理方法及装置、存储介质、电子设备，以至少解决相关技术中语音样本收集效率低、成本高的技术问题。根据本专利技术的一个实施例，提供了一种语音的处理方法，包括：将语音输入预先训练好的音素预测模型，获得所述语音对应的预测音素；对所述预测音素与所述语音的标准音素进行音素相似度匹配，得到所述预测音素与所述语...

【技术保护点】
1.一种语音的处理方法，其特征在于，包括：将语音输入预先训练好的音素预测模型，获得所述语音对应的预测音素；对所述预测音素与所述语音的标准音素进行音素相似度匹配，得到所述预测音素与所述语音的标准音素之间的音素相似度；基于所述音素相似度确定所述语音是否满足采集要求。

【技术特征摘要】
1.一种语音的处理方法，其特征在于，包括：将语音输入预先训练好的音素预测模型，获得所述语音对应的预测音素；对所述预测音素与所述语音的标准音素进行音素相似度匹配，得到所述预测音素与所述语音的标准音素之间的音素相似度；基于所述音素相似度确定所述语音是否满足采集要求。2.根据权利要求1所述的方法，其特征在于，将语音输入预先训练好的音素预测模型，获得所述语音对应的预测音素包括：对语音进行分帧处理；将分帧后的每一帧语音输入语音特征提取模块，获得所述每一帧语音的第一特征参数；将所述每一帧语音的第一特征参数输入所述预先训练好的音素预测模型，得到每一帧语音的音素预测结果；根据所述音素预测结果确定所述语音对应的预测音素。3.根据权利要求2所述的方法，其特征在于，所述预测结果包括：音素预测类别和音素预测向量；根据所述音素预测结果确定所述语音对应的预测音素包括：根据所述音素预测类别和所述音素预测向量确定所述语音对应的预测音素。4.根据权利要求3所述的方法，其特征在于，根据所述音素预测类别和所述音素预测向量确定所述语音对应的预测音素包括：将所述音素预测类别和所述音素预测向量输入集束搜索模型或者贪婪搜索模型，得到所述语音对应的预测音素；或者，根据每一类的所述音素预测类别，对其对应的所述音素预测向量进行求平均处理，得到所述语音对应的预测音素；或者，将所述音素预测类别和所述音素预测向量进行聚类处理，得到所述语音对应的预测音素。5.根据权利要求1-4任一所述的方法，其特征在于，所述音素预测模型包括语音特征提取模块、卷积神经网络、长短时记忆网络和CTC解码模块。6.根据权利要求1-5所述的方法，其特征在于，对...

【专利技术属性】
技术研发人员：聂镭，李睿，聂颖，
申请(专利权)人：龙马智芯珠海横琴科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人