使用机器学习的音频重建方法和设备技术

技术编号:24179428 阅读:53 留言:0更新日期:2020-05-16 05:56
提供了一种音频重建方法和设备,用于通过机器学习来重构从比特流获得的解码参数或音频信号来提供改进的声音质量。该音频重建方法包括:通过解码比特流获得当前帧的多个解码参数;基于包括在所述多个解码参数中的第一参数,确定包括在所述多个解码参数中并与所述第一参数相关联的第二参数的特性;通过将机器学习模型应用于所述多个解码参数中的至少一个、第二参数和第二参数的特性来获得重建的第二参数;以及基于所述重建的第二参数解码音频信号。

【技术实现步骤摘要】
【国外来华专利技术】使用机器学习的音频重建方法和设备
本公开涉及一种音频重建方法和设备,更具体地,涉及一种通过使用机器学习来重建从比特流获得的解码参数或音频信号来提供改进的声音质量的音频重建方法和设备。
技术介绍
已经开发了能够传输、再现和存储高质量音频内容的音频编解码器技术,并且当前的超高音质技术使得能够传输、再现和存储具有24比特/192kHz分辨率的音频。24比特/192kHz分辨率意味着以192kHz采样原始音频,并且可以使用24比特以2^24种状态来表示采样信号。然而,可能需要高带宽数据传输来传输高质量的音频内容。另外,高质量的音频内容具有较高的服务价格,并且需要高质量的音频编解码器,因此可能引起版权问题。此外,最近已经开始要提供高质量的音频服务,但是可能不存在以高质量记录的音频。因此,越来越需要用于将低质量音频重建为高质量的技术。为了将低质量的音频重建为高质量,可以使用人工智能(AI)。AI系统是能够实现人类级别智能的计算机系统,并且是指与现有的基于规则的智能系统不同,机器可以自主地学习、判定和变得更加智能的系统。可以与AI系统的迭代成本文档来自技高网...

【技术保护点】
1.一种音频重建方法,所述方法包括:/n通过解码比特流获得当前帧的多个解码参数;/n基于所述多个解码参数中包括的第一参数,确定包括在所述多个解码参数中并与所述第一参数相关联的第二参数的特性;/n通过将机器学习模型应用于所述多个解码参数中的至少一个、第二参数和第二参数的特性来获得重建的第二参数;以及/n基于所述重建的第二参数解码音频信号。/n

【技术特征摘要】
【国外来华专利技术】1.一种音频重建方法,所述方法包括:
通过解码比特流获得当前帧的多个解码参数;
基于所述多个解码参数中包括的第一参数,确定包括在所述多个解码参数中并与所述第一参数相关联的第二参数的特性;
通过将机器学习模型应用于所述多个解码参数中的至少一个、第二参数和第二参数的特性来获得重建的第二参数;以及
基于所述重建的第二参数解码音频信号。


2.根据权利要求1所述的音频重建方法,其中,解码所述音频信号包括:
通过基于所述第二参数的特性对所述重建的第二参数进行校正,获得校正后的第二参数;以及
基于所述校正后的第二参数解码所述音频信号。


3.根据权利要求2所述的音频重建方法,
其中,确定所述第二参数的特性包括:基于所述第一参数确定所述第二参数的范围,以及
其中,获得所述校正后的第二参数包括:当所述重建的第二参数不在所述范围内时,获得所述范围内的最接近所述重建的第二参数的值作为所述校正后的第二参数。


4.根据权利要求1所述的音频重建方法,其中,确定所述第二参数的特性包括:通过使用基于所述第一参数和所述第二参数中的至少一个预训练的机器学习模型来确定所述第二参数的特性。


5.根据权利要求1所述的音频重建方法,其中,获得所述重建的第二参数包括:
基于所述第二参数的特性确定所述第二参数的候选;以及
基于所述机器学习模型,选择所述第二参数的候选中的一个候选。


6.根据权利要求1所述的音频重建方法,其中,获得所述重建的第二参数包括:进一步基于前一帧的多个解码参数中的至少一个解码参数,获得所述当前帧的所述重建的第二参数。


7.根据权利要求1所述的音频重建方法,其中,所述机器学习模型是通过机器学习原始音频信号和所述多个解码参数中的至少一个解码参数来生成的。


8.一种音频重建方法,所述方法包括:
通过解码比特流获得当前帧的多个解码参数;
基于所述多个解码参数解码音频信号;
基于所述解码的音频信号和所述多个解码参数中的至少一个解码参数,从多个机器学习模型中选择机器学习模型;以及
通过使用所选择的机器学习模型来重建所述解码的音频信号。


9.根据权利要求8所述的音频重建方法,其中,所述机器学习模型是通过机器学习所述解码的音频信号和原始音频信号来生成的。


10.根据权利要求8所述的音频重建方法,其中,选择所述机器学习模型包括:
基于所述多个解码参数中的至少一个解码参数,确定带宽扩展的起始频率;以及
基于所述起始频率和所述解码的音频信号的频率,选择所述解码的音频信号的机器学习模型。


11.根据权利要求8所述的音频重建方法,其中,选择所述机器学习模型包括:
基于所述多...

【专利技术属性】
技术研发人员:成昊相郑钟勋朱基岘吴殷美柳宗烨
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:韩国;KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1