一种音量控制方法及装置制造方法及图纸

技术编号：13794000 阅读：65 留言：0更新日期：2016-10-06 08:24

本发明专利技术公开一种音量控制方法及装置，用以降低音量调整时延。所述方法获取当前时刻语音信号采样点的平滑音量和平滑包络；根据所述当前时刻的平滑包络和预存的多个历史时刻的平滑包络，确定第一时间段内的平滑包络与每个第二时间段内的平滑包络的自相关值；在确定出的各自相关值中，确定出数值最大的一个自相关值作为最大自相关值；根据当前时刻的平滑音量和最大自相关值确定当前时刻的组合平滑音量；根据组合平滑音量和预设参考音量确定当前时刻的音量增益；根据所述当前时刻的音量增益对下一时刻语音信号的音量进行控制。经实测，该方法可有效降低音量调整时延。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及电子信息
，尤其涉及一种音量控制方法及装置。
技术介绍
在电子信息
，语音交互已经成为人机交互、或机器与机器交互的必要手段。在语音交互过程中，音量给用户的听觉感受(即听感)是衡量语音交互质量的指标之一。实际应用场景中，信号源的语音信号音量可能存在忽高忽低的情况，这种情况为音量跳跃。若对该跳跃式的音量进行调整时，调整音量的延时超过一定时间范围(如100ms)，则用户也会听到音量忽高忽低，用户的听感就较差。通常情况下，当前时刻采集到语音信号之后，通过上一时刻的音量增益控制当前时刻的语音信号输出。然后根据当前时刻的语音信号确定当前时刻的音量增益。具体的，若当前时刻的音量未发生突变，则可将上一时刻的音量增益作为当前时刻的音量增益(即不需要对上一时刻的音量进行调整)，若当前时刻的音量发生突变(即存在音量跳跃)，则需要重新确定当前时刻的音量增益(即，需要调整上一时刻的音量增益)，以对下一时刻的音量输出进行控制。上述的音量调整包括对音量增益的调整，且音量调整时延与音量增益的调整时延成正比。若对上一时刻的音量增益的调整时延较大时，音量调整时延也较大，这样就无法及时对下一时刻突变的音量的输出进行控制，从而导致用户也会听到音量忽高忽低。然而，在现有技术中，主要通过当前时刻(如，t时刻)采集的语音信号采样点的平滑音量和用户预设的参考音量确定音量增益，通过该音量增益控制音量输出。然而，由于平滑音量无法及时反映两个相邻时刻的音量突变的情况，
因此，也就无法及时对两个相邻时刻音量的音量差进行调整(如补偿)，导致对音量增益的调整延时较大，大约...

【技术保护点】
一种音量控制方法，其特征在于，包括：获取当前时刻语音信号的平滑音量和平滑包络；根据所述当前时刻的平滑包络和预存的多个历史时刻的平滑包络，确定第一时间段内的平滑包络与每个第二时间段内的平滑包络的自相关值；其中，所述第一时间段为包含当前时刻和最近历史时刻的一个时间段，所述第二时间段为包含历史时刻的多个时间段；在确定出的各自相关值中，确定出数值最大的自相关值，作为最大自相关值；根据所述当前时刻的平滑音量和所述最大自相关值确定当前时刻的组合平滑音量；根据所述组合平滑音量和预设参考音量确定当前时刻的音量增益；根据所述当前时刻的音量增益对下一时刻语音信号的音量进行控制。

【技术特征摘要】
1.一种音量控制方法，其特征在于，包括：获取当前时刻语音信号的平滑音量和平滑包络；根据所述当前时刻的平滑包络和预存的多个历史时刻的平滑包络，确定第一时间段内的平滑包络与每个第二时间段内的平滑包络的自相关值；其中，所述第一时间段为包含当前时刻和最近历史时刻的一个时间段，所述第二时间段为包含历史时刻的多个时间段；在确定出的各自相关值中，确定出数值最大的自相关值，作为最大自相关值；根据所述当前时刻的平滑音量和所述最大自相关值确定当前时刻的组合平滑音量；根据所述组合平滑音量和预设参考音量确定当前时刻的音量增益；根据所述当前时刻的音量增益对下一时刻语音信号的音量进行控制。2.如权利要求1所述的方法，其特征在于，根据所述当前时刻的平滑音量和所述最大自相关值确定当前时刻的组合平滑音量，具体包括：确定最大自相关值与第一时间段内的平滑包络的数量的比值，作为平均最大自相关值；其中，所述第一时间段内的平滑包络为第一时间段内每个时刻的平滑包络；确定所述当前时刻的平滑音量和所述平均最大自相关值的加权平均值；将所述加权平均值作为当前时刻的组合平滑音量。3.如权利要求1所述的方法，其特征在于，获取当前时刻语音信号的平滑音量和平滑包络，具体包括：获取当前时刻语音信号的多个采样点的振幅；计算每个采样点的振幅与上一时刻音量增益的乘积，作为增益振幅；确定所述多个采样点的增益振幅的平均值，作为平均振幅；根据所述平均振幅确定所述平滑音量和平滑包络。4.如权利要求1所述的方法，其特征在于，根据所述确定出的音量增益对下一时刻语音信号的音量进行控制之前，所述方法还包括：对所述音量增益进行平滑处理；对平滑处理后的音量增益进行增益限制；对增益限制后的音量增益进行增益差分限制，将该增益差分限制后的音量增益作为当前时刻的音量增益。5.如权利要求1所述的方法，其特征在于，根据所述当前时刻的平滑音量和所述最大自相关值确定当前时刻的组合平滑音量之前，所述方法还包括：确定所述最大自相关值为满足设定条件的最大自相关值；其中，若当前时刻的最大自相关值超过预设最大自相关阈值，以及在当前时刻t和历史时刻t-j之间确定出的各最大自相关值存在局部峰值，则确定当前时刻的最大自相关值满足设定条件；其中，j为大于1的正整数。6.一种音量控制装置...

【专利技术属性】
技术研发人员：王育军，
申请(专利权)人：乐视致新电子科技天津有限公司，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人