一种基于多特征提取与融合的头势识别算法制造技术

技术编号：28218595 阅读：18 留言：0更新日期：2021-04-28 09:36

本发明专利技术公开了一种基于多特征提取与融合的头势识别算法，包括：利用RGB相机采集的视频数据，并进行数据增强，得到训练集；使用稠密光流算法从训练集中得到稠密光流图片序列，将训练集的原图片序列和提取的稠密光流图片序列分别输入RGB特征提取3DInceptionV2通道和光流特征提取3DInceptionV2通道，并进行特征交叉融合；通过3DInception模块提取融合特征的高维动作特征；通过迭代训练神经网络参数，得到3DInceptionV2网络模型参数；用RGB相机采集待识别的RGB视频数据，得到待测集，通过稠密光流算法获取稠密光流图片序列，待测集图片序列和稠密光流图片序列数据并行输入加载模型参数的双流3DInceptionV2网络中，获得对应的头势识别结果。本发明专利技术拥有更好的便携性、易用性且易于功能扩展。且易于功能扩展。且易于功能扩展。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多特征提取与融合的头势识别算法

[0001]本专利技术涉及人机交互
，特别涉及一种基于多特征提取与融合的头势识别算法。

技术介绍

[0002]人机交互是实现用户和机器之间信息交换的通路，现有交互方式主要有触控操作、手势识别、语音识别等，自然的人机交互方式是机器人智能化关键技术之一。头势识别是人与人传递特定语义，携带一些副语言信息的交互方式，通过对头部动作进行识别，可以更好地理解用户的语义，还可以通过头部动作进行机器人行为控制，所以头势识别是人机交互必不可少的分支。对大部分护理机器人来说，头势识别可以作为交互的基础组成部分，而头势是人类常用的交互方式，常常用来表示否定或肯定意愿，因此头势识别在机器人控制、人机交流等领域具有广泛的应用性。
[0003]现有技术在这方面的成果不多，如授权公告号CN101889928B的专利技术公开了一种基于头势识别技术的轮椅控制方法，在轮椅车体上安装图像采集设备、计算及控制单元、支架及电机。当使用轮椅时，图像采集设备实时的采集轮椅使用者的头部图像并传输至计算及控制单元中。计算单元通过对图像进行处理、分析和计算，得到人脸和鼻子的位置信息，并据此判断使用者的头部姿势。根据所获取的头部姿势，由计算及控制单元产生对应的控制命令。最后电机根据得到的控制命令，驱动轮椅运动。
[0004]上述现有技术主要依靠判断鼻子位置来确定头势，局限性较大，识别精确度低。

技术实现思路

[0005]针对现有技术识别精度低的问题，本专利技术提供了一种基于多特征提取与融合的头...

【技术保护点】

【技术特征摘要】
1.一种基于多特征提取与融合的头势识别算法，其特征在于，包括以下步骤：利用RGB相机采集的视频数据，并进行数据增强，得到训练集；使用稠密光流算法从训练集中得到稠密光流图片序列，将训练集的原图片序列和提取的稠密光流图片序列分别输入RGB特征提取3DInceptionV2通道和光流特征提取3DInceptionV2通道，并进行特征交叉融合；通过3DInception模块提取融合特征的高维动作特征；通过迭代训练神经网络参数，得到3DInceptionV2网络模型参数；用RGB相机采集待识别的RGB视频数据，得到待测集，通过稠密光流算法获取稠密光流图片序列，待测集图片序列和稠密光流图片序列数据并行输入加载模型参数的双流3DInceptionV2网络中，获得对应的头势识别结果。2.根据权利要求1所述的一种基于多特征提取与融合的头势识别算法，其特征在于，所述数据增强包括：对视频数据进行随机角度旋转、随机裁剪、随机调节亮度和随机调节对比度，并在视频中选取中间帧以前的任意一帧为起始帧，截取一半帧数的图像序列，得到帧数是原视频一半的若干图像序列作为训练集。3.根据权利要求1或2所述的一种基于多特征提取与融合的头势识别算法，其特征在于，所述训练集的稠密光流图片序列的获得过程包括：使用稠密光流算法提取训练集中相邻两帧图片之间的稠密光流数据，训练集中n帧光流图片序列可获得n-1帧稠密光流图片序列，复制训练集中原第一帧填...

【专利技术属性】
技术研发人员：谢佳龙，张波涛，王煜升，吴秋轩，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人