音讯处理方法及电子装置制造方法及图纸

技术编号:34382834 阅读:29 留言:0更新日期:2022-08-03 21:01
一种音讯处理方法用以对第一头部相关传输函数进行上升取样产生第二头部相关传输函数。第一头部相关传输函数其中定义多个音讯频率上多个第一音讯特征值,该些第一音讯特征值以一第一空间解析度排列。第一头部相关传输函数透过球形卷积神经网络模型上升取样为第二头部相关传输函数,第二头部相关传输函数当中定义对应该些音讯频率上多个第二音讯特征值,该些第二音讯特征值以高于第一空间解析度的一第二空间解析度排列。音讯处理方法能够将第一头部相关传输函数进行上升取样而转换为具有高空间解析度的第二头部相关传输函数。有高空间解析度的第二头部相关传输函数。有高空间解析度的第二头部相关传输函数。

【技术实现步骤摘要】
音讯处理方法及电子装置


[0001]本公开文件涉及一种用于处理音讯讯号的方法。更具体来说,本公开文件涉及一种用于处理关于音讯讯号的头部相关传输函数的方法。

技术介绍

[0002]许多声学研究人员曾多次尝试基于讯号处理技术来模拟虚拟空间声音。听者的耳朵、头部和躯干将与原始声音讯号相互作用,导致原始声音讯号的特征传递到聆听者的耳朵时发生变化、延迟或失真。上述这些聆听者感受到的变化可以用头部相关传输函数(head related transfer function,HRTF)加以描述。

技术实现思路

[0003]本公开文件提供了一种音讯处理方法包括以下步骤。接收第一头部相关传输函数其中定义多个音讯频率上多个第一音讯特征值,该些第一音讯特征值分布于一球坐标系内以一第一空间解析度排列多个第一交叉节点上。采用一球形卷积神经网络模型将该第一头部相关传输函数上升取样为一第二头部相关传输函数,其中该第二头部相关传输函数当中定义对应该些音讯频率上多个第二音讯特征值,该些第二音讯特征值分布于该球坐标系内以一第二空间解析度排列的多个第二交叉节点上,该第本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种音讯处理方法,其特征在于,该音讯处理方法,包含:接收一第一头部相关传输函数其中定义多个音讯频率上多个第一音讯特征值,该些第一音讯特征值分布于一球坐标系内以一第一空间解析度排列多个第一交叉节点上;以及采用一球形卷积神经网络模型将该第一头部相关传输函数上升取样为一第二头部相关传输函数,其中该第二头部相关传输函数当中定义对应该些音讯频率上多个第二音讯特征值,该些第二音讯特征值分布于该球坐标系内以一第二空间解析度排列的多个第二交叉节点上,该第二空间解析度高于该第一空间解析度,在该第二头部相关传输函数中对应单一个音讯频率上每一个第二音讯特征值各自是由该第一头部相关传输函数中对应多个音讯频率之一频率组合中的该些第一音讯特征值进行卷积计算得到,其中多个音讯频率的该频率组合包含不同于该单一个音讯频率的至少一音讯频率。2.根据权利要求1所述的音讯处理方法,进一步包含:利用该第二头部相关传输函数将一音讯讯号定位到空间当中一特定点,以产生一立体音讯讯号;以及将定位后的该立体音讯讯号传送至一播音器。3.根据权利要求1所述的音讯处理方法,其中该第一头部相关传输函数中的该些第一音讯特征值针对每一个第一交叉节点包含落在C个不同频道上的C个音讯幅度/相位值,该C个不同频道对应多个不同的音讯频率,以及该第一头部相关传输函数定义在该球坐标系中的N个第一交叉节点,该第一头部相关传输函数中的该些第一音讯特征值针对该N个第一交叉节点一共包含落在该C个不同频道的N*C个音讯幅度/相位值,N和C分别为大于1的正整数。4.根据权利要求3所述的音讯处理方法,其中将该第一头部相关传输函数上升取样为该第二头部相关传输函数的步骤包含:将该球形卷积神经网络模型的一第一球形卷积块套用至该第一头部相关传输函数以生成一第一隐藏张量;以及将该第一隐藏张量中的该些音讯幅度/相位值的数量扩展R倍以形成该第二头部相关传输函数,该第二头部相关传输函数定义该球坐标系中的N*R个第二交叉节点,R为大于1的有理数且N*R为整数。5.根据权利要求3所述的音讯处理方法,其中上升取样该第一头部相关传输函数至该第二头部相关传输函数的该步骤包含:将该第一头部相关传输函数中的该些音讯幅度/相位值的数量扩展R倍以形成一第二隐藏张量,该第二隐藏张量定义该球坐标系中的N*R个第二交叉节点,R为大于1的有理数且N*R为整数;以及将该球形卷积神经网络模型的一第二球形卷积块套用至该第二隐藏张量以生成该第二头部相关传输函数。6.根据权利要求3所述的音讯处理方法,其中上升取样该第一头部相关传输函数至该第二头部相关传输函数的该步骤包含:将该球形卷积神经网络模型的一第一球形卷积块套用至该第一头部相关传输函数以生成一第一隐藏张量;将该第一隐藏张量中的该些音讯幅度/相位值的数量扩展R倍以形成一第二隐藏张量,
该第二隐藏张量定义该球坐标系中的N*R个第二交叉节点,R为大于1的有理数且N*R为整数;以及将该球形卷积神经网络模型的一第二球形卷积块套用至该第二隐藏张量以生成该第二头部相关传输函数。7.根据权利要求6所述的音讯处理方法,其中将该第一隐藏张量扩展R倍的步骤包含:基于该N个第一交叉节点和该N*R个第二交叉节点的空间位置,在每个通道独立地内插计算该N*R个第二交叉节点上的该些音讯幅度/相位值。8.根据权利要求6所述的音讯处理方法,其中将该第一隐藏张量扩展R倍的步骤包含:将该些第一交叉节点当中一目标交叉节点上单个通道的单个音讯幅度/相位值复制R次,并将R个复制后的音讯幅度/相位值映射到该球坐标系中该些第二交叉节点的R个节点上,其中该些第二交叉节点的该R个节点的位置邻近于该球坐标系中该些第一交叉节点当中的该目标交叉节点。9.根据权利要求6所述的音讯处理方法,其中该第一球形卷积块或该第二球形卷积块包含一球形卷积神经网络层,该球形卷积神经网络层是由一基于图像神经网络的球形卷积网络实现。10.根据权利要求9所述的音讯处理方法,其中该球形卷积块进一步包含一正规化层、一非线性活化层或一填充层。11.根据权利要求1所述的音讯处理方法,其中该球形卷积神经网络模型的多个参数由一头部相关传输函数资料库而得到,该头部相关传输函数资料库包括多个头部相关传输函数配对,该些头部相关传输函数配对的每一对包括一低解析度头部相关传输函数和一高解析度头部相关传输函数,该低解析度头部相关传输函数是透过对...

【专利技术属性】
技术研发人员:尤靖允
申请(专利权)人:宏达国际电子股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1