The invention discloses a database building method for hand gesture recognition. The invention comprises the following steps: Step 1, from the network to collect on one hand RGB hand images, construct the database; step 2, the database of images of uniform size; the original data to a unified standard size N*M, and for each piece of hand picture name, picture file name \hand+ number\ step 3; coordinate data of each node, obtaining uniform size after hand in hand the images in the database; coordinate data of step 4, step 2 uniform size hand pictures and get through the 3 step conversion module into deep learning framework can directly use data types. The invention has better applicability and robustness, and provides a solid data base for gesture recognition, aiming at solving the problem of hand gesture recognition and promoting the development of artificial intelligence.
【技术实现步骤摘要】
一种用于手势识别的数据库建立方法
本专利技术属于计算机视觉领域,特别涉及一种用于手势识别的数据库建立方法。
技术介绍
人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。近年来,人工智能和深度学习如雨后春笋般发展起来,2016年因为Alphago战胜韩国九段李世石等众多标志性事件发生被称为AI元年。手势识别是人工智能领域中非常重要的一个领域,在人机沟通、智能驾驶、智能家居方面具有良好的应用前景,因此手势数据集的构建吸引了一些学者的兴趣。建立一个完善的手势识别数据集可以推动手势识别精度大幅提高,从而推动手势识别在生活中的广泛应用。因此,建立一个完善的手势识别数据集有非常重要的研究意义和应用价值。研究人员尝试各种方法来使数据集包含丰富的手部信息,通常邀请志愿者到实验室中佩戴实验设备,采集数据。此类数据集存在如下缺点:1、实验室场地有限,获取的数据场景单一;2、志愿者数量有限,获取的手势种类不足;3、干扰因素少。目前人工智能仍处于数据驱动的阶段,用此类数据集训练得到的模型鲁棒性、泛化性较差,在实际应用中效果较差,不能达到令人满意的效果,以及场景复杂性,更接近现实生活。本专利技术处理图像数据并获得图像中手的节点信息。
技术实现思路
本专利技术构建了一个完备的针对手势识别的数据集,包含了丰富的场景,不再是传统简单的实验室场景,接近现实生活,并包含了多样的手势,基本涵盖了一只手可以实现的所有手势,具有较好的适用性和鲁棒性,为手势识别提供了坚实的数据基础,旨在解决手势识别问题,推动人工智能的发展。一种用于手势识别的数据库建立方法, ...
【技术保护点】
一种用于手势识别的数据库建立方法,其特征在于包括如下步骤:步骤1、从网络上收集关于单只手的RGB手部图片,构建数据库;步骤2、对数据库中的图片统一尺寸;将原始数据统一到一个标准尺寸N*M,并对每张手部图片进行命名,图片文件名称为“hand+序号”;步骤3、获取数据库中统一尺寸后的手部图片中手的各个节点的坐标数据;所述的坐标数据的标记通过标记模块实现,坐标数据包括手腕坐标和每个手指每个节点坐标;坐标数据的标记顺序:首先标记获取手腕部坐标,再依次获取大拇指、食指、中指、无名指和小拇指上各个关节点的坐标;每个手指的标记顺序为从手指根部开始,依次标记到手指顶部;步骤4、将步骤2统一尺寸后手部图片和步骤3获取的坐标数据通过转换模块转换成深度学习框架能够直接使用的数据类型。
【技术特征摘要】
2017.03.09 CN 20171013773331.一种用于手势识别的数据库建立方法,其特征在于包括如下步骤:步骤1、从网络上收集关于单只手的RGB手部图片,构建数据库;步骤2、对数据库中的图片统一尺寸;将原始数据统一到一个标准尺寸N*M,并对每张手部图片进行命名,图片文件名称为“hand+序号”;步骤3、获取数据库中统一尺寸后的手部图片中手的各个节点的坐标数据;所述的坐标数据的标记通过标记模块实现,坐标数据包括手腕坐标和每个手指每个节点坐标;坐标数据的标记顺序:首先标记获取手腕部坐标,再依次获取大拇指、食指、中指、无名指和小拇指上各个关节点的坐标;每个手指的标记顺序为从手指根部开始,依次标记到手指顶部;步骤4、将步骤2统一尺寸后手部图片和步骤3获取的坐标数据通过转换模块转换成深度学习框架能够直接使用的数据类型。2.根据权利要求1所述的一种用于手势识别的数据库建立方法,其特征在于步骤3所述的标记模块包括存储单元和鼠标点击单元,其具体实现过程如下:手部图片输入到标记模块后,先将该输入的手部图片的文件名和长宽写入存储单元;再通过鼠标点击单元左键点击输入的手部图片中的节点,以一个圆点作为节点记号,同时将该节点记号的坐标数据输入至存储单元;在鼠标点击单元左键点击输入的手部图片中节点的过程中,若该手部图片中存在不可见节点,则将鼠标点击单元移动至手部图片的外侧区域,然后通过鼠标点击单元左键点击该外侧区域,此时自动将该不可见节点的坐标数据记为(-1,-1),同时将该节点记号的坐标数据输入至存储单元;通过深度学习方法,同时结合数据库训练得到手势模型,将一张全新的手部图片输入该手势模型完成节点位置的判断,输出手部图片中每个节点的坐标数据,利用输出的坐标数据能够还原出手部图片中的手势,进而进行相关判断和控制。3.根据权利要求1所述的一种用于手势识别的数据库建立方法,其特征在于步骤4所述的转换模块实现过程有两种,其中转换为Hdf5类型数据如下:1.为数据库中的每张手部图片分配内存空间,同时为该手部图片在存储单元中的坐标数据分配内存空间;2.将每张手部图片中所有节点的坐标数据以矩阵形式读入,经过矩阵转置,每个矩阵行向量对应一张手部图...
【专利技术属性】
技术研发人员:邵碧尧,颜成钢,王雁刚,谢益峰,李宁,项露萱,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。