语音处理方法、装置、电子设备以及存储介质制造方法及图纸

技术编号：31832380 阅读：31 留言：0更新日期：2022-01-12 13:09

本公开提供了语音处理方法、装置、电子设备、存储介质以及程序产品，涉及人工智能技术领域，尤其涉及车联网和智能座舱等技术领域。具体实现方案为：响应于语音交互功能被唤醒，获取被用于唤醒语音交互功能的唤醒语音的唤醒声纹特征；从接收到的交互语音中提取至少一个交互声纹特征，交互语音中包括至少一个单声源交互语音，至少一个单声源交互语音与至少一个交互声纹特征一一对应；从至少一个交互声纹特征中确定与唤醒声纹特征相匹配的目标交互声纹特征；从与目标交互声纹特征相对应的目标单声源交互语音中提取目标语音特征；以及发送目标语音特征，以便基于目标语音特征，进行语音识别。音识别。音识别。

全部详细技术资料下载

【技术实现步骤摘要】
语音处理方法、装置、电子设备以及存储介质

[0001]本公开涉及人工智能
，尤其涉及语音、云计算等
具体涉及语音处理方法、装置、电子设备、存储介质及程序产品。

技术介绍

[0002]语音交互是人类比较自然的交互方式。随着人工智能技术的不断发展，已经实现让机器能够听懂人类发出的语音，理解语音中的内在含义，并作出相应的反馈。在进行语音交互过程中，需要进行声学处理、语音识别、语义理解等自然语言理解的操作，还需要进行语音合成的自然语言生成的操作。在真实环境中，众多操作可能会面临环境噪音大、语音中的语义复杂等的问题，为语音交互顺畅、智能地进行造成障碍。

技术实现思路

[0003]本公开提供了一种语音处理方法、装置、电子设备、存储介质以及程序产品。
[0004]根据本公开的一方面，提供了一种语音处理方法，包括：响应于语音交互功能被唤醒，获取被用于唤醒所述语音交互功能的唤醒语音的唤醒声纹特征；从接收到的交互语音中提取至少一个交互声纹特征，所述交互语音中包括至少一个单声源交互语音，所述至少一个单声源交互...

【技术保护点】

【技术特征摘要】
1.一种语音处理方法，包括：响应于语音交互功能被唤醒，获取被用于唤醒所述语音交互功能的唤醒语音的唤醒声纹特征；从接收到的交互语音中提取至少一个交互声纹特征，所述交互语音中包括至少一个单声源交互语音，所述至少一个单声源交互语音与所述至少一个交互声纹特征一一对应；从所述至少一个交互声纹特征中确定与所述唤醒声纹特征相匹配的目标交互声纹特征；从与所述目标交互声纹特征相对应的目标单声源交互语音中提取目标语音特征；以及发送目标语音特征，以便基于所述目标语音特征，进行语音识别。2.根据权利要求1所述的方法，还包括，在所述响应于语音交互功能被唤醒，获取被用于唤醒所述语音交互功能的唤醒语音的唤醒声纹特征之前：从接收到的所述唤醒语音中，提取所述唤醒语音的唤醒声纹特征；基于所述唤醒声纹特征，确定所述唤醒语音的声源；以及响应于确定所述唤醒语音的声源为人声源，基于所述唤醒语音，确定所述语音交互功能的唤醒结果。3.根据权利要求1或2所述的方法，其中，所述从所述至少一个交互声纹特征中确定与所述唤醒声纹特征相匹配的目标交互声纹特征包括：针对所述至少一个交互声纹特征中的每个交互声纹特征，确定所述交互声纹特征与所述唤醒声纹特征之间的声纹相似度；以及从所述至少一个交互声纹特征中确定声纹相似度最高的交互声纹特征，作为所述目标交互声纹特征。4.根据权利要求3所述的方法，其中，所述针对所述至少一个交互声纹特征中的每个交互声纹特征，确定所述交互声纹特征与所述唤醒声纹特征之间的声纹相似度包括：确定与所述交互声纹特征相对应的单声源交互语音的声源；以及响应于确定所述单声源交互语音的声源为人声源，确定所述交互声纹特征与所述唤醒声纹特征之间的声纹相似度。5.根据权利要求1所述的方法，其中，所述发送目标语音特征包括：确定所述目标单声源交互语音的数据量；以及响应于所述数据量大于或等于预定数据量阈值，发送目标语音特征。6.根据权利要求1至5任一项所述的方法，其中，所述方法应用于语音交互设备；所述发送目标语音特征包括：利用所述语音交互设备将所述目标语音特征发送至云服务器，以便所述云服务器基于所述目标语音特征，进行语音识别。7.一种语音处理装置，包括：唤醒声纹获取模块，用于响应于语音交互功能被唤醒，获取被用于唤醒所述语音交互功能的唤醒语音的唤醒声纹特征；交互声纹提取模块，用于从接收到的交互语音中提取至少一个交互声纹特征，所述交互语音中包括至少一个单声源交互语音，所述至少一个单声源交互语音与所述至少一个交互声纹特征一一对应；
确定模块...

【专利技术属性】
技术研发人员：周毅，
申请(专利权)人：阿波罗智联北京科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人