【技术实现步骤摘要】
【国外来华专利技术】用于自适应背景音频增益平滑的装置和方法
[0001]本专利技术涉及一种用于自适应背景音频增益平滑的装置和方法,例如,用于对实时场景中为自动回避背景内容而产生的增益信号进行平滑的装置和方法
。
技术介绍
[0002]在两个或更多个不同音频信号的自动混合的情况下,其中一个信号
(
前景
)
由语音组成
(
有或没有背景噪声
)
,第二信号
(
或一组信号
)
由背景声音
(
包括例如音乐
、
一般声音如环境音
、
噪声
、
动效拟音
、
音效,但可能也包括语音
)
组成,后一个信号
(
背景
)
的音频水平可能需要被衰减,以确保包括在前景信号中的语音一旦与输出节目中的背景信号混合就仍然是可理解的
。
[0003]为了达到美观的混合效果,背景信号的时变衰减应该尽可能小
、
平滑和不引人注目以不中断内容流
。
它仍然应该与收听环境
、
播放系统或接收者的收听能力所要求的一样高
。
这两个相反的要求在非自适应系统中很难实现
。
最终,自动生成的混合节目的美学质量高度取决于混合方法识别和分析输入信号的相关特征的能力,例如,语音内容的存在或不存在,分量信号电平,背景信号内容类别
(
音乐,噪声 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.
一种用于提供输出增益序列的装置
(100)
,其中输出增益序列适合于衰减音频信号的背景信号,其中所述装置
(100)
包括:信号特征提供器
(110)
,被配置为接收或确定关于音频信号的一个或多个特征的信号特征信息,其中信号特征信息取决于背景信号,信号特征信息包括取决于音频信号的背景信号和前景信号的输入增益序列;以及增益序列发生器
(120)
,被配置为根据输入增益序列确定输出增益序列;其中,为了确定输出增益序列,将输出增益序列的当前增益的当前增益值修改为目标增益值,增益序列发生器
(120)
被配置为通过在转换时段期间根据修改规则逐渐改变当前增益值至目标增益值,来确定在增益序列中继当前增益之后的多个后续增益,其中,修改规则取决于信号特征信息;和
/
或其中,增益序列发生器
(120)
被配置为除了输入增益序列之外,还根据一个或多个信号特征中的另一个来确定目标增益值
。2.
根据权利要求1所述的装置
(100)
,其中,为了衰减背景信号或增加背景信号的衰减,增益序列发生器
(120)
被配置为通过在转换时段期间根据修改规则逐渐改变当前增益值至目标增益值,来确定继当前增益之后的多个后续增益,使得转换时段的持续时间取决于信号特征信息
。3.
根据权利要求1或2所述的装置
(100)
,其中,如果输入增益序列的较小的第一输入增益值比第二输入增益值指示背景信号对前景信号的较大的干扰,较小的第一输入增益值导致与输入增益序列的第二输入增益值较大时的转换时段的第二持续时间相比较短的转换时段的第一持续时间,或其中,如果输入增益序列的较小的第一输入增益值比第二输入增益值指示背景信号对前景信号的较小的干扰,较小的第一输入增益值导致与输入增益序列的第二输入增益值较大时的转换时段的第二持续时间相比较长的转换时段的第一持续时间
。4.
根据上述权利要求中任何一个所述的装置
(100)
,其中,为了减少背景信号的衰减,增益序列发生器
(120)
被配置为根据信号特征信息从两个或更多个修改规则候选中选择修改规则候选作为修改规则;其中,与增益序列发生器
(120)
选择两个或更多个修改规则中的第二个时的转换时段的第二持续时间相比,增益序列发生器
(120)
选择两个或更多个修改规则候选中的第一个导致较短的转换时段的第一持续时间,在转换时段期间,增益序列发生器
(120)
将当前增益值逐渐改变为目标增益值
。5.
根据权利要求4所述的装置
(100)
,其中,增益序列发生器
(120)
被配置为,如果信号特征信息指示背景信号的当前部分包括语音,或如果信号特征信息包括高于语音阈值的
、
背景信号包括语音的概率的置信度值,选择两个或更多个修改规则候选中的第一个;以及增益序列发生器
(120)
被配置为,如果信号特征信息指示背景信号的当前部分不包括语音,或者如果置信度值小于或等于语音阈值,选择两个或更多个修改规则候选中的第二个
。6.
根据权利要求4或5所述的装置
(100)
,其中,两个或更多个修改规则候选中的每一个定义至少两个子修改规则,其中至少两个子修改规则中的第一个在转换时段的第一子时段期间应用,其中至少两个子修改规则中的第二个在转换时段的第二子时段期间应用,其中第二子时段在时间上在第一子时段之后,并且其中,至少两个子修改规则中的第一个与至少两个子修改规则中的第二个相比,定
义从多个后续增益中的一个到其直接后继的朝目标增益值的更快适应
。7.
根据上述权利要求中任何一个所述的装置
(100)
,其中,为衰减背景信号或增加背景信号的衰减,增益序列发生器
(120)
被配置为根据输入增益序列的输入增益和根据背景信号中语音的存在来确定目标增益值
。8.
根据权利要求7所述的装置
(100)
,其中,增益序列发生器
(120)
被配置为,如果信号特征信息指示背景信号包括语音或指示背景信号包括语音的概率的置信度值大于阈值,确定目标增益值是取决于输入增益的第一值,其中,增益序列发生器
(120)
被配置为,如果信号特征信息指示背景信号不包括语音或指示背景信号包括语音的概率的置信度值小于或等于阈值,确定目标增益值为取决于输入增益的第二值,第二值与第一值不同,其中,与在背景信号上应用具有第二值的目标增益值相比,在背景信号上应用具有第一值的目标增益值更多地衰减背景信号
。9.
根据上述权利要求中任何一个所述的装置
(100)
,其中,信号特征提供器
(110)
被配置为根据信号特征信息确定是否应修改输出增益序列的当前增益的当前增益值
。10.
根据权利要求9所述的装置
(100)
,其中,信号特征提供器
(110)
被配置为使用输入增益序列的当前输入增益的当前输入增益值用于阈值测试来进行阈值测试,其中阈值测试包括确定当前输入增益值是否小于阈值,或阈值测试包括确定当前输入增益值是否小于或等于阈值
。11.
根据权利要求
10
所述的装置
(100)
,其中,阈值根据期望目标值和容差值定义,其中,信号特征提供器
(110)
被配置为根据阈值测试确定是否应修改输出增益序列的当前增益的当前增益值,以及其中,信号特征提供器
(110)
被配置为,如果当前输入增益值小于期望目标增益减去容差值,确定应修改输出增益序列的当前增益的当前增益值,或其中,信号特征提供器
(110)
被配置为,如果当前输入增益值大于期望目标增益加上容差值,确定应修改输出增益序列的当前增益的当前增益值
。12.
根据上述权利要求中任何一个所述的装置
(100)
,其中前景信号和背景信号被编码在音频帧序列中,和
/
或其中音频信号被编码在音频帧序列中,其中,待由增益序列发生器
(120)
确定的输出增益序列是与音频帧序列的当前帧相关联的输出增益的当前序列,以及其中,为了确定输出增益的当前序列,增益序列发生器
(120)
被配置为使用在音频帧序列的当前帧中编码的信息,而不使用在时间上在当前音频帧之后的音频帧序列的后续帧中编码的信息
。13.
根据上述权利要求中任何一个所述的装置
(100)
,其中,增益序列发生器
(120)
被配置为确定自适应攻击时间,使得转换时段的持续时间
取决于自适应攻击时间,在转换时段期间,增益序列发生器被配置为通过逐渐改变当前增益值来确定继当前增益之后的多个后续增益,其中,增益序列发生器
(120)
被配置为根据自适应攻击时间确定继当前增益之后的多个后续增益
。14.
根据权利要求
13
所述的装置
(100)
,其中,增益序列发生器
(120)
被配置为根据输入增益序列的输入增益中的一个的输入增益值来确定自适应攻击时间,或指示存储在装置的当前输入增益缓冲器内的输入增益序列的多个输入增益的多个输入增益值的平均值
。15.
根据权利要求
14
所述的装置
(100)
,其中,信号特征提供器
(110)
被配置为根据以下确定自适应攻击时间:其中
AAT
为自适应攻击时间,其中
minAT
为预定义的最小攻击时间,其中
maxAT
为预定义的最大攻击时间,其中如果允许重置自适应攻击时间值,
AAT(t
‑
1)
被设置为
maxAT
,否则使用先前的
...
【专利技术属性】
技术研发人员:亚历山德罗,
申请(专利权)人:弗劳恩霍夫应用研究促进协会,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。