一种调整音频信息的方法、装置、设备及存储介质制造方法及图纸

技术编号:37974404 阅读:30 留言:0更新日期:2023-06-30 09:49
本申请实施例提供了一种调整音频信息的方法、装置、设备及存储介质,涉及音频处理技术领域,该方法包括:获取待展示视频的原始图像信息和原始音频信息,然后对原始图像信息进行运动估计,确定待展示视频中的运动对象并标记运动对象的运动轨迹;再从待展示视频的原始音频信息中识别出运动对象对应的初始音频信息;根据运动对象的运动轨迹调整初始音频信息,这样不仅使运动对象的音频信息调整不脱离实际的声音,同时使得运动对象在运动过程中,用户相应听到的运动对象的声音也是相应变化的,从而增加用户的沉浸感,也可以增强声音的分布感和真实感。和真实感。和真实感。

【技术实现步骤摘要】
一种调整音频信息的方法、装置、设备及存储介质


[0001]本专利技术涉及音频处理
,尤其涉及一种调整音频信息的方法、装置、设备及存储介质。

技术介绍

[0002]近年来随着科技发展,消费者对虚拟现实产品的需求日益增长,市场上涌现出各种各样的虚拟现实的显示产品来满足客户需求。增强现实(Augmented Reality,简称AR)和虚拟现实技术(Virtual Reality,简称VR)都需要通过头戴设备来观看画面。AR是一种实时地计算摄影机摄影的位置及角度并加上相应图像、视频、3D模型的技术,该技术可以在屏幕上把虚拟世界嵌套在现实世界展示并进行互动。VR利用并综合三维图形技术、多媒体技术等多种高科技的最新发展成果,借助计算机等设备产生一个逼真的三维视觉、听觉等多种感官体验的虚拟世界。对于一般的基于视频的AR、VR系统,只有比较单一的图像信息的增强,对于一些交互娱乐感和真实沉浸感要求较高的系统,则需要引入对声音信息的增强来加强体验者对混合环境的感知。
[0003]相关技术下,虚拟现实产品引用的发声声源为单声道音频,然而在现实生活中,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种调整音频信息的方法,其特征在于,包括:获取待展示视频的原始图像信息和原始音频信息;对所述原始图像信息进行运动估计,确定所述待展示视频中的运动对象以及所述运动对象的运动轨迹;对所述原始音频信息进行识别,确定所述运动对象的初始音频信息;基于所述运动对象的运动轨迹,调整所述运动对象的初始音频信息,获得目标音频信息。2.如权利要求1所述的方法,其特征在于,所述基于所述运动对象的运动轨迹,调整所述运动对象的初始音频信息,获得目标音频信息,包括:将所述运动对象的初始音频信息添加至立体声道中多个声道;基于所述运动对象的运动轨迹,分别调整每个声道上的所述运动对象的初始音频信息,获得所述多个声道的目标音频信息。3.如权利要求2所述的方法,其特征在于,所述运动对象的运动轨迹包括水平方向的运动矢量和垂直方向的运动矢量;所述基于所述运动对象的运动轨迹,分别调整每个声道上的所述运动对象的初始音频信息,获得所述多个声道的目标音频信息,包括:针对所述立体声道中每个声道,基于所述运动对象在水平方向的运动矢量和运动时刻,对所述运动对象的初始音频信息中相应运动时刻的音频音量进行调整,获得水平方向的调整结果;基于所述运动对象在垂直方向的运动矢量和运动时刻,对所述运动对象的初始音频信息中相应运动时刻的音频音量进行调整,获得垂直方向的调整结果;基于所述水平方向的调整结果和所述垂直方向的调整结果,确定所述声道的目标音频信息。4.如权利要求3所述的方法,其特征在于,所述基于所述运动对象在垂直方向的运动矢量和运动时刻,对所述运动对象的初始音频信息中相应运动时刻的音频音量进行调整,获得垂直方向的调整结果,包括:若所述运动对象在垂直方向的运动方向为从上向下,则基于所述运动对象在垂直方向的运动矢量和运动时刻,增大所述运动对象的初始音频信息中相应运动时刻的音频音量,获得垂直方向的调整结果。5.如权利要求3所述的方法,其特...

【专利技术属性】
技术研发人员:余横李锋韩晶晶
申请(专利权)人:上海顺久电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1