音频识别方法、装置及设备制造方法及图纸

技术编号：37991607 阅读：25 留言：0更新日期：2023-06-30 10:06

本申请公开了音频识别方法、装置及设备，属于计算机技术领域。方法包括：获取多个初始音频，多个初始音频对应同一个音频提供对象，音频提供对象的对象信息未知；拼接多个初始音频中的不相连的初始音频，得到多个拼接音频，拼接音频携带的目标语调特征强于初始音频中携带的初始语调特征；获取基准音频的声纹，基准音频对应的对象信息已知；根据多个拼接音频和基准音频的声纹确定多个初始音频的音频识别结果。通过拼接不相连的初始音频，使得拼接音频携带的目标语调特征强于初始语调特征。通过特征更强的目标语调特征辅助音频的识别，提高音频识别的准确率。高音频识别的准确率。高音频识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
音频识别方法、装置及设备

[0001]本申请实施例涉及计算机
，特别涉及一种音频识别方法、装置及设备。

技术介绍

[0002]随着计算机技术的发展，越来越多的应用场景开始重视信息安全，并利用身份认证技术保证信息安全。例如，通过音频识别确定音频提供对象的身份，以进行身份认证。

技术实现思路

[0003]本申请实施例提供了一种音频识别方法、装置及设备，可用于通过音频识别确定音频提供对象的身份。所述技术方案如下：
[0004]一方面，本申请实施例提供了一种音频识别方法，所述方法包括：
[0005]获取多个初始音频，所述多个初始音频对应同一个音频提供对象，所述音频提供对象的对象信息未知；
[0006]拼接所述多个初始音频中的不相连的初始音频，得到多个拼接音频，所述拼接音频携带的目标语调特征强于所述初始音频中携带的初始语调特征；
[0007]获取基准音频的声纹，所述基准音频对应的对象信息已知；
[0008]根据所述多个拼接音频和所述基准音频的声纹确定所述多个初始音频的音频识别结果。
[本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种音频识别方法，其特征在于，所述方法包括：获取多个初始音频，所述多个初始音频对应同一个音频提供对象，所述音频提供对象的对象信息未知；拼接所述多个初始音频中的不相连的初始音频，得到多个拼接音频，所述拼接音频携带的目标语调特征强于所述初始音频中携带的初始语调特征；获取基准音频的声纹，所述基准音频对应的对象信息已知；根据所述多个拼接音频和所述基准音频的声纹确定所述多个初始音频的音频识别结果。2.根据权利要求1所述的方法，其特征在于，所述根据所述多个拼接音频和所述基准音频的声纹确定所述多个初始音频的音频识别结果，包括：获取所述多个拼接音频的多个第一声纹，一个拼接音频对应至少一个第一声纹，所述一个拼接音频对应的第一声纹中存在至少一个第一声纹根据所述音频提供对象的目标语调特征确定；将所述多个第一声纹与多个第二声纹进行匹配，得到所述多个初始音频和所述基准音频的音频匹配结果，所述第二声纹为所述基准音频的声纹，所述多个第二声纹中存在至少一个第二声纹根据所述基准音频对应的目标语调特征确定；根据所述音频匹配结果确定所述多个初始音频的音频识别结果。3.根据权利要求2所述的方法，其特征在于，所述获取所述多个拼接音频的多个第一声纹，包括：对于任一拼接音频，对所述任一拼接音频进行音频切分，得到至少一个第一音频，所述至少一个第一音频中存在第一音频包括所述拼接音频的音频拼接点，所述音频拼接点携带所述音频提供对象的目标语调特征；提取所述至少一个第一音频中的各个第一音频的声纹，得到所述第一声纹。4.根据权利要求3所述的方法，其特征在于，所述对所述任一拼接音频进行音频切分，得到至少一个第一音频，包括：确定用于音频切分的移动窗口的长度和所述移动窗口的步长；根据所述移动窗口的长度和所述移动窗口的步长，参考所述任一拼接音频的音频拼接点对所述任一拼接音频进行音频切分，得到所述至少一个第一音频。5.根据权利要求4所述的方法，其特征在于，所述用于音频切分的移动窗口为多个，多个移动窗口中的任一移动窗口的长度和其他移动窗口的长度不同，所述其他...

【专利技术属性】
技术研发人员：张新成，任伟，和心愿，
申请(专利权)人：北京梧桐车联科技有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人