一种语音数据获取方法、装置、设备和介质制造方法及图纸

技术编号:40549627 阅读:22 留言:0更新日期:2024-03-05 19:08
本申请实施例提供了一种语音数据获取方法、装置、设备和介质。所述方法包括:检查第一缓冲区、第二缓冲区、第三缓冲区和第四缓冲区的存储状态;第一缓冲区中的数据是从第三缓冲区中获取的,第二缓冲区中的数据是从第四缓冲区中获取的,第三缓冲区用于存储从音频输出通路上采集的参考音,第四缓冲区用于存储从音频输入通路上采集的环境音;在检查到第一缓冲区与第二缓冲区中的数据量相等且第一缓冲区、第二缓冲区、第三缓冲区和第四缓冲区的容量均未溢出的情况下,读取第一缓冲区中的待拼接参考音和第二缓冲区中的待拼接环境音;根据预先测定的时延将读取到的待拼接参考音与待拼接环境音对齐,并拼接,得到目标语音数据。得到合格的语音数据。

【技术实现步骤摘要】

本申请涉及声学领域,更具体地说涉及计算机声学处理领域,特别是涉及一种语音数据获取方法、装置、设备和介质


技术介绍

1、随着科技的发展,汽车也进入了智能时代。很多智能汽车都带有智能语音识别功能,车载麦克风(microphone,mic)从车内采集到环境音后传输给车机系统,车机系统(ivisoc,in-vehicle infotainment system on chip)对接收到的环境音进行语音识别,例如是从环境音中识别出用于控制智能汽车的语音指令。

2、但是,mic采集到的环境音中可能混杂智能汽车上的车载扬声器输出的声音。例如,车内驾乘人员在讲述语音指令时车内车载扬声器正在播放音乐,此时,mic会同时采集到车载扬声器输出的声音和车内驾乘人员讲话的声音。mic采集到的环境音中混杂的扬声器输出的声音会干扰语音识别。因此,需要对采集的环境音进行回声消除处理,即需要从采集到的环境音中消除掉采集到的扬声器输出的声音。

3、目前,通用的消回声方案是在车机系统向车载扬声器输出音频时回采该输出音频,将该回采的输出音频作为参考音(reference本文档来自技高网...

【技术保护点】

1.一种语音数据获取方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述预先测定的时延包括:预先测定的通路时延;所述通路时延是用于描述针对一音频数据从所述音频输出通路输出变成目标声音且所述目标声音被所述音频输入通路采集到的过程中从所述音频输出通路上采集到所述音频数据的采集时间与从所述音频输入通路上采集到所述音频数据的采集时间之间的时差;所述根据预先测定的时延将读取到的所述待拼接参考音与所述待拼接环境音对齐,包括:

3.根据权利要求2所述的方法,其特征在于,所述预先测定的时延还包括:预先测定的开启时延;所述开启时延是用于描述开启参考音采集...

【技术特征摘要】

1.一种语音数据获取方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述预先测定的时延包括:预先测定的通路时延;所述通路时延是用于描述针对一音频数据从所述音频输出通路输出变成目标声音且所述目标声音被所述音频输入通路采集到的过程中从所述音频输出通路上采集到所述音频数据的采集时间与从所述音频输入通路上采集到所述音频数据的采集时间之间的时差;所述根据预先测定的时延将读取到的所述待拼接参考音与所述待拼接环境音对齐,包括:

3.根据权利要求2所述的方法,其特征在于,所述预先测定的时延还包括:预先测定的开启时延;所述开启时延是用于描述开启参考音采集硬件的开启时间与开启环境音采集硬件的开启时间之间的时差;所述根据预先测定的时延将读取到的所述待拼接参考音与所述待拼接环境音对齐,包括:

4.根据权利要求2或3所述的方法,其特征在于,所述通路时延是在所述检查第一缓冲区、第二缓冲区、第三缓冲区和第四缓冲区的存储状态之前,通过以下步骤测定的:

5.根据权利要求4所述的方法,其特征在于,所述特征音频数据包括前序特征音频数据和后序特征音频数据;所述根据所述参考音采集硬件采集到的音频数据和所述环境音采集硬件采集到的音频数据,确定通路时延,包括:

6.根据权利要求4所述的方法,其特征在于,所述方法还包括:

7.根据权利要求1所述的方法,其特征在于,所述方法还包括:

【专利技术属性】
技术研发人员:乔亚鹏
申请(专利权)人:合肥杰发科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1