当前位置: 首页 > 专利查询>郤少维专利>正文

VR声音位置信息处理方法、装置及设备制造方法及图纸

技术编号:37508875 阅读:15 留言:0更新日期:2023-05-07 09:48
本公开涉及一种VR声音位置信息处理方法、装置及设备,属于声音处理技术领域。本公开通过图像识别技术获取全景VR画面中声源在平面图上的坐标点p(m,n),其中m和n分别为横、纵坐标值;所述平面图为所述全景VR画面在二维空间的投影;将所述p变换为所述全景VR画面中的声源方位k(x,y),其中x和y分别为垂直方位角和水平方位角。本公开方法,通过将声音处理问题转换为二维图像处理问题,利用现有图像处理技术进行准确声源识别,再将识别出的声源位置通过空间变换技术获取其在360

【技术实现步骤摘要】
VR声音位置信息处理方法、装置及设备


[0001]本公开涉及声音处理
,具体涉及一种VR声音位置信息处理方法、装置及设备。

技术介绍

[0002]VR(虚拟现实技术)的发展历史比较长远,在VR视频中,画面信息为360
°
全景画面,声音是最重要的用来吸引观众视角的元素。因此,声音的指向性也是360
°
全方位的,这样才能完美的呈现VR这种媒体介质最核心的优势——沉浸感。
[0003]在制作VR视频中声音位置这一个环节,传统的制作流程是在得到前期拍摄的全景VR影像内容之后,根据画面中声源所处的位置,在声音制作软件中,将该声源的声音信号赋予其位置信息。具体的,目前VR声音的工作流程是在声音制作软件(如ProTools,Nuendo,Reaper等)中进行声音处理,外部同步GoPro VR Player来播放全景的VR画面作为参考,利用声音软件中的HeadTracking功能,用头戴VR设备作为控制器,控制陀螺仪,来联动GoPro VR Player进行画面的转动。声音制作人员依靠转动头戴VR设备,人为的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种VR声音位置信息处理方法,其特征在于,包括:通过图像识别技术获取全景VR画面中声源在平面图上的坐标点p(m,n),其中m和n分别为横、纵坐标值;所述平面图为所述全景VR画面在二维空间的投影;将所述p变换为所述全景VR画面中的声源方位k(x,y),其中x和y分别为垂直方位角和水平方位角。2.根据权利要求1所述的方法,其特征在于,所述全景VR画面为全景VR视频影像的帧或关键帧。3.根据权利要求2所述的方法,其特征在于,还包括获取所述全景VR视频影像的平面图序列,以及从该平面图序列提取关键帧的步骤。4.根据权利要求3所述的方法,其特征在于,还包括将所述全景VR视频影像投影到平面图序列的步骤。5.根据权利要求1所述的方法,其特征在于,所述投影采用ERP投影;所述k通过下式计算:其中,M为所述平面图宽度,N为所述平面图高度。6.根据权利要求1

5任一所述的方法,其特征在于,还包括:将所述x和y作为声音位置信息写入所述声源的声音信号。7.一种VR视频处理方法,基于权利要求7所述的一种VR声音位置信息处理方法,其特征在于,包括:将全景VR视频影像投影为二维画面;利用图像识别技术确定声源在二维画面的坐标;将所述二维画面的坐...

【专利技术属性】
技术研发人员:郤少维
申请(专利权)人:郤少维
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1