一种基于3D手势识别的音频控制方法技术

技术编号:11875915 阅读:84 留言:0更新日期:2015-08-13 02:39
本发明专利技术公开了一种基于3D手势识别的音频控制方法,包括以下步骤:S1、获取手势识别区域内的电场数据;S2、在手势识别区域内建立空间3D坐标系;S3、获取手势识别区域内电场变化区域的位置坐标;S4、重复步骤S3,得到电场变化区域位置坐标的动态变化数据;S5、根据X轴坐标的动态变化数据实时调整音频的音量大小;S6、根据Y轴坐标的动态变化数据实时控制音频之间的切换;S7、根据Z轴坐标的动态变化数据实时控制音频的播放与暂停。本发明专利技术通过对3D空间中手势动作的识别,实现了对智能设备上音频的播放/暂停、音量大小调节以及音频之间的切换等操作,具有自然性、简洁性、新颖性等特点。

【技术实现步骤摘要】

本专利技术属于嵌入式软件
,具体涉及一种基于3D手势识别的音频控制方法的设计。
技术介绍
在用户与智能设备的交互过程中,输入方式显得尤为重要,便捷的输入方式会增强用户的体验效果。现有技术中,智能设备上音频控制的输入方式普遍采用为键盘输入或触摸输入。一方面,这两种输入方式是成熟而稳定的实现方案,基本上已经被用户接受;另一方面,这两种输入方式缺乏一定的创新性,难以实现用户对智能设备的个性化定制。最近几年,随着计算机技术的迅猛发展,研宄符合人际交流习惯的新颖人机交互技术变得异常活跃,也取得了可喜的进步,这些研宄包括人脸识别、面部表情识别、唇读、头部运动跟踪、凝视跟踪、手势识别以及体势识别等等。总的来说.人机交互技术已经从以计算机为中心逐步转移到以人为中心,是多媒体、多种模式的交互技术。手势是指在人的意识支配下,人手作出的各类动作,如手指弯曲、伸展和手在空间的运动等,可以是执行某项任务,也可以是与人的交流,以表达某种含义或意图。手势是一种自然、直观、易于学习的人机交互手段,以人手直接作为计算机的输入设备,人机间的通讯将不再需要中间的媒体,用户可以简单地定义一种适当的手势来对周围的机器进行控制。以人手直接作为输入手段与其它输入方式相比较,具有自然性、简洁性、丰富性和直接性的特点。
技术实现思路
本专利技术的目的是为了解决现有技术中智能设备上音频控制的输入方式缺乏一定的创新性,难以实现用户对智能设备的个性化定制的问题,提出了一种基于3D手势识别的音频控制方法。本专利技术的技术方案为:一种基于3D手势识别的音频控制方法,包括以下步骤:S1、获取手势识别区域内的电场数据;S2、在手势识别区域内建立空间3D坐标系;S3、获取手势识别区域内电场变化区域的位置坐标;S4、重复步骤S3,得到电场变化区域位置坐标的动态变化数据;S5、根据X轴坐标的动态变化数据实时调整音频的音量大小;S6、根据Y轴坐标的动态变化数据实时控制音频之间的切换;S7、根据Z轴坐标的动态变化数据实时控制音频的播放与暂停。进一步地,步骤S2具体包括以下分步骤:S21、在手势识别区域内选定一点作为坐标原点;S22、确定X轴、Y轴与Z轴的正方向,建立空间3D坐标系。进一步地,步骤S5具体包括以下分步骤:S51、设定X轴坐标数据的变化量与音量大小变化量的对应关系;S52、设定X轴坐标数据的采集时间间隔ΛΤΧ;S53、根据公式⑴计算每一采集时间间隔Λ !;内X轴坐标数据的变化量:AXn= Xn-Xn^1 (n = 1,2,3...)(I);S54、根据步骤S51中设定的对应关系对音频的音量大小进行实时调整。进一步地,步骤S6具体包括以下分步骤:S61、设定Y轴坐标数据的采集时间间隔ATy;S62、根据公式(2)计算每一采集时间间隔Λ 1;内Y轴坐标数据的变化量:Δ Yn= Y(n = 1,2,3...)(2);S63、设定音频切换触发阈值Ymax与Y min;S64、将Y轴坐标数据的变化量Δ Yn分别与Y max及Y min进行比较,若Λ Yn> = Ymax,则切换至音频播放列表中的下一个音频;若Λ Yn〈 = Ymin,则切换至音频播放列表中的上一个音频;若Ymin〈 Δ Yn〈Ymax,则继续播放当前音频。进一步地,Y—值为正,Y _值为负。进一步地,步骤S7具体包括以下分步骤:S71、定义单击触发阈值Zm;S72、定义单击触发条件:当Z轴坐标数据首先减少,并且减少量超过单击触发阈值zm,随后Z轴坐标数据再增加,并且增加量超过单击触发阈值zm,则定义为触发一次单击,记单击次数Nz= I ;S73、设定单击次数判定时间间隔ΔΤΖ;S74、根据单击次数判定时间间隔Δ Tz内的单击次数Nz实时控制音频的播放与暂停:若Nz = I,则播放音频;若Nz= 2,则暂停音频;若Nz# I且N 2,则保持音频当前状态。本专利技术的有益效果是:本专利技术通过对3D空间中手势动作的识别,实现了对智能设备上音频的播放/暂停、音量大小调节以及音频之间的切换等操作,能够实现产品的个性化定制功能,具有自然性、简洁性、新颖性等特点。【附图说明】图1为本专利技术提供的一种基于3D手势识别的音频控制方法流程图。图2为本专利技术步骤S2的分步骤流程图。图3为本专利技术步骤S5的分步骤流程图。图4为本专利技术步骤S6的分步骤流程图。图5为本专利技术步骤S7的分步骤流程图。【具体实施方式】下面结合附图对本专利技术的实施例作进一步的说明。本专利技术提供了一种基于3D手势识别的音频控制方法,如图1所示,包括以下步骤:S1、获取手势识别区域内的电场数据;这里采用电场强度传感器对手势识别区域进行测量,获取手势识别区域内的初始电场数据,其目的在于:(I)为随后在手势识别区域内建立空间3D坐标系提供参考;(2)便于随后获取电场信号的动态变化数据。S2、在手势识别区域内建立空间3D坐标系;如图2所示,该步骤具体包括以下分步骤:S21、在手势识别区域内选定一点作为坐标原点;本专利技术中,对坐标原点位置的选定并无明确限制,通常坐标原点会选在靠近手势识别区域中心的位置。S22、确定X轴、Y轴与Z轴的正方向,建立空间3D坐标系。本专利技术实施例中,将电场强度传感器的背对方向作为Y轴的正方向建立Y轴;将电场强度传感器正对方向的右方作为X轴的正方向,垂直于Y轴建立X轴;将电场强度传感器正对方向的上方作为Z轴的正方向,垂直于X轴和Y轴所在平面建立Z轴,以此建立空间3D坐标系。S3、获取手势识别区域内电场变化区域的位置坐标;S4、重复步骤S3,得到电场变化区域位置坐标的动态变化数据;由于用户手势的变化会切割手势识别区域内的电场线,从而造成电场信号数据的变化,因此电场变化区域的位置坐标即可反应用户手势的位置,而用户手势变化的物理动作便可以由电场变化区域位置坐标的动态变化数据来表征。S5、根据X轴坐标的动态变化数据实时调整音频的音量大小;如图3所示,该步骤具体包括以下分步骤:S51、设定X轴坐标数据的变化量与音量大小变化量的对应关系;本专利技术实施例中,X轴坐标数据的变化量与音量大小变化量的对应关系设定为:X轴坐标数据每增加1当前第1页1 2 本文档来自技高网...

【技术保护点】
一种基于3D手势识别的音频控制方法,其特征在于,包括以下步骤:S1、获取手势识别区域内的电场数据;S2、在手势识别区域内建立空间3D坐标系;S3、获取手势识别区域内电场变化区域的位置坐标;S4、重复步骤S3,得到电场变化区域位置坐标的动态变化数据;S5、根据X轴坐标的动态变化数据实时调整音频的音量大小;S6、根据Y轴坐标的动态变化数据实时控制音频之间的切换;S7、根据Z轴坐标的动态变化数据实时控制音频的播放与暂停。

【技术特征摘要】

【专利技术属性】
技术研发人员:杨天虎杨伟茂孙国辉
申请(专利权)人:成都上生活网络科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1