【技术实现步骤摘要】
本专利技术属于投影音频,具体而言,涉及一种多投影控制主机的音频控制方法、介质及系统。
技术介绍
1、多声源语音/音频信号处理技术在许多领域得到了广泛应用,如电影院、音乐会、多媒体演示等环境。传统的音频系统通常采取集中控制的方式,将音频信号统一处理后,通过均匀分布的扬声器阵列播放。这种做法虽然简单,但无法实现针对不同区域或位置的音频个性化渲染。
2、近年来,随着虚拟现实(vr)、增强现实(ar)、扩展现实(xr)等新兴技术的兴起,对多声源音频信号处理的要求越来越高。拥有真实沉浸感和临场感的高品质音频输出,成为吸引用户的关键所在。然而,现有技术在满足不同场景和用户需求方面仍存在一些不足。
3、但是对于多投影控制主机的播放应用场景,音频无法针对不同区域进行有效的声场控制和渲染。投影机和扬声器是分散布置的,如果统一输出音频信号,往往会导致某些区域的音质效果欠佳,无法让观众身临其境。
技术实现思路
1、有鉴于此,本专利技术提供一种多投影控制主机的音频控制方法、介质及系统,能够
...【技术保护点】
1.一种多投影控制主机的音频控制方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种多投影控制主机的音频控制方法,其特征在于,所述针对每个音频通道,利用卷积神经网络从音频数据流中提取时域和频域特征作为综合特征的步骤,具体是:设置一维卷积层,采用一维卷积核对时域音频序列进行滑动卷积,捕获音频数据在不同时间尺度上的特征作为时域特征;通过池化层进行降采样操作,采用最大池化或平均池化提取出音频信号在更大时间尺度下的演变规律;设置二维卷积层,将时域音频信号转化为频谱图像,再利用二维卷积核对其进行滑动卷积,从频域上提取特征作为频域特征。
3.根据
...【技术特征摘要】
1.一种多投影控制主机的音频控制方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种多投影控制主机的音频控制方法,其特征在于,所述针对每个音频通道,利用卷积神经网络从音频数据流中提取时域和频域特征作为综合特征的步骤,具体是:设置一维卷积层,采用一维卷积核对时域音频序列进行滑动卷积,捕获音频数据在不同时间尺度上的特征作为时域特征;通过池化层进行降采样操作,采用最大池化或平均池化提取出音频信号在更大时间尺度下的演变规律;设置二维卷积层,将时域音频信号转化为频谱图像,再利用二维卷积核对其进行滑动卷积,从频域上提取特征作为频域特征。
3.根据权利要求2所述的一种多投影控制主机的音频控制方法,其特征在于,所述一维卷积层采用指数线性单元作为激活函数,所述池化层包括最大池化层和平均池化层,两种池化层的输出特征图被串联。
4.根据权利要求1所述的一种多投影控制主机的音频控制方法,其特征在于,所述将提取的时域和频域特征融合,构建音频信号的特征表示作为综合特征的步骤,具体是:使用注意力机制赋予不同特征不同权重,先将所有特征展平,然后将展平后的特征向量与权重向量进行点积作为注意力得分,再通过softmax函数转化为特征权重;通过全连接层整合加权后的所有特征,对上一层特征进行线性组合,生成综合了时域和频域多模态特征的音频信号综合特征向量。
5.根据权利要求4所述的一种多投影控制主机的音频控制方法,其特征在于,所述注意力机制使用缩放点积注意力,所述缩放点积注意力中的缩放因子设置为特征维度的平方根的倒数。
6.根据权利要求1所述的一种多投影控制主机的音频控制方法,其特征在于,所述针...
【专利技术属性】
技术研发人员:周安斌,晏武志,潘见见,
申请(专利权)人:山东金东数字创意股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。