时延估计调整方法、装置、设备以及存储介质制造方法及图纸

技术编号：30021159 阅读：15 留言：0更新日期：2021-09-11 06:41

本公开提供了时延估计调整方法、装置、设备、存储介质以及程序产品，涉及人工智能领域，尤其涉及计算机技术、智能交通领域。具体实现方案为：初始化时延估计的最大值；在试音音乐播放过程中估计第一时延值；在试音合成语音播放过程中估计第二时延值；基于第一时延值和第二时延值，调整时延估计的最大值。本公开能够针对性地调整时延估计的最大值，大大缩短算法收敛时间。收敛时间。收敛时间。

全部详细技术资料下载

【技术实现步骤摘要】
时延估计调整方法、装置、设备以及存储介质

[0001]本公开涉及人工智能领域，尤其涉及计算机技术、智能交通领域。

技术介绍

[0002]智能后视镜可以通过投屏技术将音频传输到原生车机中进行播放。但因为传输数据量巨大，往往音频播放存在一定的延时。这类延时对语音信号处理产生了较大的负面影响，因为硬件降噪芯片的限制，目前的信号处理技术无法在非常规(>40ms)延时的情况进行。因此，智能后视镜引入了时延估计算法，通过计算时延并对语音信号进行延时。
[0003]为了不影响整体体验，时延估计算法通常会把时延估计的最大值限定在较小的范围内(比如1000ms)。但因为每款支持投屏的原生车机性能不一致，导致真实的传输时延波动较大。如果此时将时延估计的最大值统一加大，又会出现收敛时间加长的问题。

技术实现思路

[0004]本公开提供了一种时延估计调整方法、装置、设备、存储介质以及程序产品。
[0005]根据本公开的第一方面，提供了一种时延估计调整方法，包括：初始化时延估计的最大值；在试音音乐播放过程中估计第一时延值；在试音合成语音播放过程中估计第二时延值；基于第一时延值和第二时延值，调整时延估计的最大值。
[0006]根据本公开的第二方面，提供了一种时延估计调整装置，包括：设置模块，被配置成初始化时延估计的最大值；第一估计模块，被配置成在试音音乐播放过程中估计第一时延值；第二估计模块，被配置成在试音合成语音播放过程中估计第二时延值；调整模块，被配置成基于第一时延值和第二时延值，调整时...

【技术保护点】

【技术特征摘要】
1.一种时延估计调整方法，包括：初始化时延估计的最大值；在试音音乐播放过程中估计第一时延值；在试音合成语音播放过程中估计第二时延值；基于所述第一时延值和所述第二时延值，调整所述时延估计的最大值。2.根据权利要求1所述的方法，其中，所述在试音音乐播放过程中估计第一时延值，包括：在试音音乐播放过程中持续估计时延值，得到所述试音音乐的至少一次时延值，以及基于所述试音音乐的至少一次时延值，得到所述第一时延值；以及所述在试音合成语音播放过程中估计第二时延值，包括：在试音合成语音播放过程中持续估计时延值，得到所述试音合成语音的至少一次时延值，以及基于所述试音合成语音的至少一次时延值，得到所述第二时延值。3.根据权利要求2所述的方法，其中，所述在试音音乐播放过程中持续估计时延值，得到所述试音音乐的至少一次时延值，以及基于所述试音音乐的至少一次时延值，得到所述第一时延值，包括：在试音音乐播放过程中持续估计时延值，直至得到连续第一预设数目次相同的时延值，作为所述第一时延值；以及所述在试音合成语音播放过程中持续估计时延值，得到所述试音合成语音的至少一次时延值，以及基于所述试音合成语音的至少一次时延值，得到所述第二时延值，包括：在试音合成语音播放过程中持续估计时延值，直至得到连续第二预设数目次相同的时延值，作为所述第二时延值。4.根据权利要求1所述的方法，其中，所述基于所述第一时延值和所述第二时延值，调整所述时延估计的最大值，包括：基于所述第一时延值和所述第二时延值中的最大值，调整所述时延估计的最大值。5.根据权利要求4所述的方法，其中，所述基于所述第一时延值和所述第二时延值中的最大值，调整所述时延估计的最大值，包括：将所述第一时延值和所述第二时延值中的最大值增加预设时长，作为所述时延估计的最大值。6.根据权利要求1
‑
5中任一项所述的方法，其中，所述初始化时延估计的最大值，包括：将所述时延估计的最大值初始设置为时延估计算法的上限值。7.一种时延估计调整装置，包括：设置模块，被配置成初始化时延估计的最大值；第一估计模块，被配置成在试音音乐播放过程中估计第一时延值；第二估计模块，被配置成在试音合成语音播放过程中估计第...

【专利技术属性】
技术研发人员：刘嵘，
申请(专利权)人：阿波罗智联北京科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人