【技术实现步骤摘要】
一种基于音频多普勒特征量化的手势识别方法
本专利技术属于人机交互
,特别是涉及一种基于音频多普勒特征量化的裸手手势识别方法。
技术介绍
手势作为一种简单自然的交互方式,更加符合人的交流习惯,手势识别技术是自然人机交互的重要途径。基于视觉、可穿戴设备的惯性传感器和波动信号多普勒效应都可以实现手势识别,视觉识别方法对光线的敏感性、可穿戴设备对使用过程的约束都限制了其应用范围。基于波动信号的多普勒效应实现手势识别能很好的克服上述两种方法的缺点,为此出现了多种基于多普勒效应的手势识别方法,如公开专利:CN103793059A、CN106295684A,公开了基于专用的射频雷达,检测多普勒频移,实现手势识别的方法;CN103399634A,公开了一种音频分析和视频分析提取手势运动轨迹实现手势识别的方法,基于麦克风阵列的基频周围频段能量为主要特征。CN104898844A,公开了一种基于超声波定位的手势识别与控制装置,主要基于多普勒频移特征,CN105094298A,公开了一种终端以及基于该终端的手势识别方法,利用终端音频信号的多普勒频移和振幅作为特征,辅助其它传感器实 ...
【技术保护点】
一种基于音频多普勒特征量化的手势识别方法,其特征在于,包含以下步骤:步骤1、音频信号采集:通过音频源发出固定频率的音频,并通过音频接收阵列对声波信号进行捕获,采样频率要大于波源频率的两倍;将捕获到的信号送入计算装置进行后续处理;步骤2、多普勒频移提取:对数字化采集得到的数字信号加窗后,对其进行快速傅里叶变换(FFT),主要利用频谱的幅值特性,根据多普勒效应计算公式得到最大频移量,提取频移区间的幅值向量;步骤3、频移特征量化:分解手势实施过程对音频多普勒效应的影响,频移区间的幅值向量能反应手势实施过程的能量分布特征,计算一组特征向量;步骤4、手势分割:输入音频信号为连续不断的 ...
【技术特征摘要】
1.一种基于音频多普勒特征量化的手势识别方法,其特征在于,包含以下步骤:步骤1、音频信号采集:通过音频源发出固定频率的音频,并通过音频接收阵列对声波信号进行捕获,采样频率要大于波源频率的两倍;将捕获到的信号送入计算装置进行后续处理;步骤2、多普勒频移提取:对数字化采集得到的数字信号加窗后,对其进行快速傅里叶变换(FFT),主要利用频谱的幅值特性,根据多普勒效应计算公式得到最大频移量,提取频移区间的幅值向量;步骤3、频移特征量化:分解手势实施过程对音频多普勒效应的影响,频移区间的幅值向量能反应手势实施过程的能量分布特征,计算一组特征向量;步骤4、手势分割:输入音频信号为连续不断的时间帧数据,通过手势分割步骤提取出有效手势,即确定每个手势的开始时刻与结束时刻;步骤5、手势建模:通过对特征基元序列的训练,可以建立复杂的手势库;具体是采用HMM分类器,建立各类自定义手势的HMM模型,穷举测试确定最优的隐含状态数目;从而为手势语义集中每个手势训练HMM,将手势识别的问题转化为HMM模型的估值问题、学习问题和解码问题;在步骤6中,利用HMM估值问题识别手势;步骤6、手势识别:将实时采集的数据按照步骤2、3、4处理后,得到的特征向量序列作为观测序列,输入到步骤5建立的手势模型,计算每类手势模型产生对应观测序列的概率,概率最大的即为对应的手势类别。2.根据权利要求1所述的音频多普勒特征量化的手势识别方法,其特征在于:在步骤2中,经过数字化采集得到一帧数据,从中随机提取左右双声道中任意一单声道数据进行加窗处理,海明(Hamming)窗是余弦窗的一种,又称改进的升余弦窗;海明窗加权的系数能使旁瓣达到更小,对应的窗函数为其中N=L-1,L为窗体的长度,通过窗函数对信号进行截断,减少了频谱能量泄漏;数字音频信号加Hamming窗后,进行FFT变换完成时域到频域的信号转换,由于主要利用频谱的幅值特性,在计算过程中,可以舍弃相位信息;根据采样定理,采样频率要大于信号频率的两倍,声源频率为f0,并设置相应的采样频率fsample,因此频谱图上拥有N/2点的幅值向量,用来表示不超过fsample/2的频率范围,频率分辨率为fsample/N;根据多普勒效应计算公式其中Δf=f-f0,f为观测到的频率,f0为波源频率,c是声波在空气中的传播速度,Δv是观测者相对波源的速度(此处波源静止,因此Δv即为手势运动的速度);根据手臂运...
【专利技术属性】
技术研发人员:艾浩军,王壹丰,门怡芳,费豪,李铮,
申请(专利权)人:武汉大学,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。