一种基于图像追踪技术实现的声音音量控制方法技术

技术编号:17248001 阅读:24 留言:0更新日期:2018-02-11 06:03
本发明专利技术公开了一种基于图像追踪技术实现声音音量控制方法,包括:步骤1)在虚拟现实场景下通过图像追踪技术追踪当前场景中终端设备相对的现实目标物体marker位置;步骤2)计算场景中终端设备到现实目标物体marker的距离;步骤3)根据场景中终端设备到现实目标物体marker的距离大小,由此控制声音音量的大小控制。本发明专利技术使用图像追踪技术计算的相对与真实物体的位置结果,相应的改变音频、视频等播放的音量大小,使增强现实应用多了声音增强维度。

【技术实现步骤摘要】
一种基于图像追踪技术实现的声音音量控制方法
本专利技术属于一种基于图像追踪技术实现的声音音量控制方法。
技术介绍
增强现实(简称AR):通过实时计算摄像头影像的位置及角度并加上相应图像,视频,3D模型等虚拟信息达到与现实世界进行融合互动的场景效果。图像追踪技术:把摄像头捕获到的图像数据作为输入源,运用相关算法追踪输入源中某个指定的区域的图像,并计算出该区域想对输入源的旋转和位移。Marker————现实目标物体。现有技术在增强现实应用时,可以播放视频或音频,视频或音频的音量固定,音量不能随着用户终端设备的位置移动而发生变化。不能增强用户的真实感。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于图像追踪技术实现声音音量控制方法。本专利技术解决上述技术问题所采取的技术方案如下:一种基于图像追踪技术实现声音音量控制方法,包括:步骤1)在虚拟现实场景下通过图像追踪技术追踪当前场景中终端设备相对的现实目标物体marker位置;步骤2)计算场景中终端设备到现实目标物体marker的距离;步骤3)根据场景中终端设备到现实目标物体marker的距离大小,由此实现声音音量的大小控制。优选的是,步骤1)中,具体包括:把摄像头捕获到的图像数据作为输入源,追踪输入源中某个指定的区域的图像,并计算出该区域想对输入源的旋转和位移,由此得到旋转的一个3*4矩阵;其中,该矩阵表示终端设备在当前画面中的相对marker的位置和旋转,其中R表示旋转,T表示了位移。优选的是,步骤2)中,具体包括:通过下面的算法得到两点间的距离;floatdx=t1-0;floatdy=t2-0;floatdz=t3-0;floatd=sqrt(dx•dx+dy•dy+dz•dz);d=abs(d);其中,sqrt为开平方根,abs为取绝对值;当d为0时,场景中,终端设备和marker完全重合,d值越大代表终端设备和marker距离越远。优选的是,步骤3)中,具体包括:设音量的范围为0到vMax,0为静音,vMax为最大音量,d值的范围为0到dMax,当d值为dMax时音量为0,通过下面的公式计算出最终输出的音量值:floatvolume=vMax-d*(vMax/dMax);其中,通过volume值来控制音频输出音量,达到在增强现实场景中音量随终端设备的移动而发生大小变化。步骤3)中,用户的终端设备离现实目标物体越近,听到的声音音量越大,反之越小。本专利技术使用图像追踪技术计算的相对与真实物体的位置结果,相应的改变音频、视频等播放的音量大小,使增强现实应用多了声音增强维度。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。附图说明下面结合附图对本专利技术进行详细的描述,以使得本专利技术的上述优点更加明确。其中,图1是本专利技术基于图像追踪技术实现声音音量控制方法的流程示意图。具体实施方式以下将结合附图及实施例来详细说明本专利技术的实施方式,借此对本专利技术如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本专利技术中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本专利技术的保护范围之内。另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。如图1所示,一种基于图像追踪技术实现声音音量控制方法,包括:步骤1)在虚拟现实场景下通过图像追踪技术追踪当前场景中终端设备相对的现实目标物体marker位置;步骤2)计算场景中终端设备到现实目标物体marker的距离;步骤3)根据场景中终端设备到现实目标物体marker的距离大小,由此实现声音音量的大小控制。优选的是,步骤1)中,具体包括:把摄像头捕获到的图像数据作为输入源,追踪输入源中某个指定的区域的图像,并计算出该区域想对输入源的旋转和位移,由此得到旋转的一个3*4矩阵;其中,该矩阵表示终端设备在当前画面中的相对marker的位置和旋转,其中R表示旋转,T表示了位移。优选的是,步骤2)中,具体包括:通过下面的算法得到两点间的距离;floatdx=t1-0;floatdy=t2-0;floatdz=t3-0;floatd=sqrt(dx•dx+dy•dy+dz•dz);d=abs(d);其中,sqrt为开平方根,abs为取绝对值;当d为0时,场景中,终端设备和marker完全重合,d值越大代表终端设备和marker距离越远。优选的是,步骤3)中,具体包括:设音量的范围为0到vMax,0为静音,vMax为最大音量,d值的范围为0到dMax,当d值为dMax时音量为0,通过下面的公式计算出最终输出的音量值:floatvolume=vMax-d*(vMax/dMax);其中,通过volume值来控制音频输出音量,达到在增强现实场景中音量随终端设备的移动而发生大小变化。步骤3)中,用户的终端设备离现实目标物体越近,听到的声音音量越大,反之越小。其中,更具体地说,本专利技术的目的在于解决现有增强现实应用中缺少的声音维度的增强现实。其中,3D引擎中存在x,y,z三个坐标的三维空间坐标系:其中,通过图像追踪技术算法可以得到当前场景中终端设备相对于的marker的位置和旋转的一个3*4矩阵。如:这个矩阵表示了终端设备在当前画面中的相对marker的位置和旋转,其中R表示旋转,T表示了位移。为了计算场景中终端设备到marker的距离,这里只取矩阵中最后一列t1,t2,t3的值,它代表在当前坐标系中终端设备中心点的x、y、z的值。通过下面的算法可以得到两点间的距离。floatdx=t1-0;floatdy=t2-0;floatdz=t3-0;floatd=sqrt(dx•dx+dy•dy+dz•dz);d=abs(d);解释:sqrt为开平方根,abs为取绝对值;解释:sqrt为开平方根,abs为取绝对值;当d为0时,场景中,终端设备和marker完全重合,d值越大代表终端设备和marker距离越远。设音量的范围为0到vMax,0为静音,vMax为最大音量。d值的范围为0到dMax,我们设定当d值为dMax时音量为0,可以通过下面的公式计算出最终输出的音量值:floatvolume=vMax-d*(vMax/dMax);最终使用volume值来控制音频输出音量,达到在增强现实场景中音量随终端设备的移动而发生大小变化。本专利技术使用图像追踪技术计算的相对与真实物体的位置结果,相应的改变音频、视频等播放的音量大小,使增强现实应用多了声音增强维度。其中,该专利技术使增强现实应用多了声音增强维度,试想在一个增强现实场景中存在一个人物模型在唱歌,用户的终端设备离现实物体越近,听到的歌声越大,反之越小,就仿佛置身于真实环境一样。需要说明的是,对于上述方法实施例而言,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其本文档来自技高网...
一种基于图像追踪技术实现的声音音量控制方法

【技术保护点】
一种基于图像追踪技术实现声音音量控制方法,包括:步骤1)在虚拟现实场景下通过图像追踪技术追踪当前场景中终端设备相对的现实目标物体marker位置;步骤2)计算场景中终端设备到现实目标物体marker的距离;步骤3)根据场景中终端设备到现实目标物体marker的距离大小,由此实现声音音量的大小控制。

【技术特征摘要】
1.一种基于图像追踪技术实现声音音量控制方法,包括:步骤1)在虚拟现实场景下通过图像追踪技术追踪当前场景中终端设备相对的现实目标物体marker位置;步骤2)计算场景中终端设备到现实目标物体marker的距离;步骤3)根据场景中终端设备到现实目标物体marker的距离大小,由此实现声音音量的大小控制。2.根据权利要求1所述的基于图像追踪技术实现声音音量控制方法,其特征在于,步骤1)中,具体包括:把摄像头捕获到的图像数据作为输入源,追踪输入源中某个指定的区域的图像,并计算出该区域想对输入源的旋转和位移,由此得到旋转的一个3*4矩阵;其中,该矩阵表示终端设备在当前画面中的相对marker的位置和旋转,其中R表示旋转,T表示了位移。3.根据权利要求2所述的基于图像追踪技术实现声音音量控制方法,其特征在于,步骤2)中,具体包括:通过下面的算法得到两点间的距离;floatdx=t1-0;floatdy=t2...

【专利技术属性】
技术研发人员:陈更史凌波
申请(专利权)人:北京易讯理想科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1