根据基于独特键值的网络指导和调节的信号变换制造技术

技术编号：38014726 阅读：39 留言：0更新日期：2023-06-30 10:38

一种方法包括接收输入音频和具有目标音频特性的目标音频。该方法包括基于输入音频和目标音频中的一者或多者来估计表示目标音频特性的键值参数。该方法还包括配置神经网络，该神经网络被训练为由键值参数配置，键值参数使神经网络执行输入音频的信号变换，以产生具有与目标音频特性相对应且匹配的输出音频特性的输出音频。性的输出音频。性的输出音频。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】根据基于独特键值的网络指导和调节的信号变换

[0001]本公开涉及执行键值指导信号变换。

技术介绍

[0002]静态机器学习(ML)网络可以建模和学习固定信号变换函数。当存在多个不同的信号变换时或在连续时变变换的情况下，静态ML模型倾向于学习，例如，次优随机平均变换。
附图说明
[0003]图1是配置有被训练的神经网络模型以执行动态键值指导信号变换的示例系统的高级框图。
[0004]图2是用于训练图1的系统的神经网络的机器学习(ML)模型以进行信号变换的第一示例训练过程的流程图。
[0005]图3是用于训练ML模型以执行信号变换的第二示例训练过程的流程图。
[0006]图4是示例高级通信系统的框图，其中神经网络一旦被训练，就可以被部署以执行推断阶段键值指导信号变换。
[0007]图5是第一示例发射机过程的流程图，该第一示例发射机过程在通信系统的发射机中执行以在用非编码输入信号训练ML模型时产生与ML模型相容的比特流。
[0008]图6是第二示例发射机过程的流程图，该第二示例发射机过程在通信系统的发射机中执行以在用编码输入信号训练ML模型时产生与ML模型相容的比特流。
[0009]图7是在通信系统的接收机中执行的示例推断阶段接收机过程的流程图。
[0010]图8是使用先前训练为由键值参数配置以执行信号变换的神经网络来执行键值指导信号变换的示例方法的流程图。
[0011]图9是被配置为实现文中给出的实施例的计算机设备的框图。
具体实施...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种方法，包括：接收输入音频和具有目标音频特性的目标音频；基于输入音频和目标音频中的一者或多者来估计表示目标音频特性的键值参数；以及配置神经网络，该神经网络被训练为由键值参数配置，键值参数使神经网络执行输入音频的信号变换，以产生具有与目标音频特性相对应且匹配的输出音频特性的输出音频。2.如权利要求1所述的方法，其中，该估计包括对目标音频进行频谱分析，使得键值参数表示目标音频的目标频谱特性；以及该配置包括用键值参数配置神经网络，以使神经网络执行信号变换作为输入音频的输入频谱特性到与目标频谱特性相匹配的输出音频的输出频谱特性的变换。3.如权利要求1所述的方法，其中，该估计包括执行线性预测(LP)分析以产生频谱包络键值参数作为该键值参数，所述频谱包络键值参数包括表示目标音频的目标频谱包络的线频谱频率(LSF)或LP系数(LPC)；以及该配置包括使用频谱包络键值参数配置神经网络，以使神经网络执行信号变换作为输入音频的输入频谱包络到与目标频谱包络匹配的输出音频的输出频谱包络的变换。4.如权利要求1所述的方法，其中，该估计包括执行谐波分析以产生表示目标音频中存在的目标谐波的谐波键值参数作为该键值参数；以及该配置包括使用谐波键值参数配置神经网络，以使神经网络对输入音频进行信号变换，使得输出音频包括与目标谐波匹配的谐波。5.如权利要求1所述的方法，其中，该估计包括执行时间分析以产生表示目标音频的目标时间特性的时间键值参数作为该键值参数；以及该配置包括用时间键值参数配置神经网络，以使神经网络执行信号变换，作为输入音频的时间特性到与目标时间特性匹配的输出音频的时间特性的变换。6.如权利要求5所述的方法，其中，目标时间特性和输出音频的时间特性均为各自的时间振幅特性。7.如权利要求1所述的方法，其中，估计键值参数包括估计以下中的至少两个：时间键值参数，其表示目标音频的时间振幅特性；频谱包络键值参数，包括代表目标音频的目标频谱包络的线频谱频率(LSF)或LP系数(LPC)；以及谐波键值参数，其表示目标音频中存在的谐波。8.如权利要求1所述的方法，其中，所述输入音频和所述目标音频包括各自的音频帧序列；估计键值参数包括逐帧估计键值参数；以及配置神经网络包括用逐帧估计的键值参数配置神经网络，使神经网络逐帧执行信号变换，以产生作为音频帧序列的输出音频。9.如权利要求1所述的方法，其中，输入音频包括编码的输入音频。
10.如权利要求1所述的方法，其中，键值参数包括编码的键值参数。11.一种装置，包括：解码器，用于解码编码的输入音频和编码的键值参数，以分别产生输入音频和键值参数；以及神经网络，其被训练为由键值参数配置以执行代表输入音频的音频...

【专利技术属性】
技术研发人员：A，
申请(专利权)人：DTS公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人