手势数据集合的生成方法及生成系统、存储介质技术方案

技术编号:33708759 阅读:49 留言:0更新日期:2022-06-06 08:37
本发明专利技术公开了一种手势数据集合的生成方法及生成系统、存储介质。其中手势数据集合成的生成方法,包括:利用红外相机采集原始图像,所述原始图像包括手势分析数据、手势目标数据和背景数据;对原始图像进行预处理,得到分割后的手势分析数据、分割后的手势目标数据和待合成的背景数据;根据分割后的手势分析数据对分割后的手势目标数据进行调整,生成目标数量的待合成的手势目标数据;将待合成的手势目标数据和待合成的背景数据进行合成处理,获得初始手势合成图像。本发明专利技术通过调整、拟合等手段生成了大量不同与相机真实拍摄的样本相符的图像数据,从而节省样本生成的人力、物力。物力。物力。

【技术实现步骤摘要】
手势数据集合的生成方法及生成系统、存储介质


[0001]本专利技术涉及计算机视觉
,尤其涉及一种手势数据集合的生成方法及生成系统、存储介质。

技术介绍

[0002]近年来,随着深度学习理论和计算机算力的不断发展,深度学习已经在计算机视觉中的图像识别、图像检测、图像分割、生成式对抗网络等方向取得了重大突破,并成功应用在人脸识别、车辆检测、人物换脸和视频修复等多个领域并取得了良好的效果。然而,由于任务的复杂性,深度学习的神经网络模型通常含有以百万为单位的参数,训练如此巨大的网络模型需要大量充分的数据,例如著名的ImageNet数据集包含了20000多个类别,1500万左右的图片。因此,大规模的标记数据对于深度学习来说至关重要。
[0003]现有公开的手势数据集存在一些不足,包括:一是数据中大部分为RGB,而IR图像数据(IR图像数据为红外图像传感器输出的红外图像数据)相对较少;二是数据通常以采集者的需求进行采集,对于不是采集者外的使用人来说就不友好且不灵活,无法根据使用人的实际需求来定义采集内容,受限过多;三是采集环境条件存在差异,如采集相机差异,导致采集的数据也存在差异,兼容性差而无法得到较好的效果;四是数据多样性不够,如在采集器的不同位置,不同距离等情形下的手势在细节、亮暗程度上有较大区别,能覆盖的应用场景显得不足。
[0004]虽然红外图像的应用越来越广并被人们普遍接受,但是实际采集数据却不是一件容易的事,任务量太大,需要消耗大量的人力、财力、时间及精力,导致采集足够多的数据变得比较困难,但是没有新的数据集又很难开展后续的工作,这将面临到进退两难的囧境。

技术实现思路

[0005]为了解决现有技术中获得足够数量的手势数据集合比较困难的技术问题,本专利技术提出了手势数据集合的生成方法及生成系统、存储介质。
[0006]本专利技术提出的手势数据集合成的生成方法,包括:
[0007]步骤1,利用红外相机采集原始图像,所述原始图像包括手势分析数据、手势目标数据和背景数据;
[0008]步骤2,对原始图像进行预处理,得到分割后的手势分析数据、分割后的手势目标数据和待合成的背景数据;
[0009]步骤3,根据分割后的手势分析数据对分割后的手势目标数据进行调整,生成目标数量的待合成的手势目标数据;
[0010]步骤4,将待合成的手势目标数据和待合成的背景数据进行合成处理,获得初始手势合成图像。
[0011]进一步,还包括:步骤5,对初始合成图像进行后处理,获得最终的手势合成数据。
[0012]进一步,利用所述红外相机采集预设数量的有效范围内不同距离、同视场内不同
位置且空白背景的手势图像形成所述手势分析数据;
[0013]和/或利用所述红外相机采集预设数量的预设距离内、同视场内中心位置、单一角度且空白背景的手势图像形成所述手势目标数据;
[0014]和/或利用所述红外相机采集预设数量的有效范围内不含手势的各种场景的图像形成所述背景数据。
[0015]进一步,所述预处理包括对所述手势分析数据、手势目标数据进行数据转换使得原始图像的像素值满足阈值区间[0,255],和/或调整原始图像的大小,和/或对原始图像进行滤波、平滑、降噪处理当中的至少一种。
[0016]进一步,所述预处理包括对所述背景数据进行旋转、裁剪、缩放、对比度调整、明暗度调整中的一种或组合操作,得到目标合成数量的待合成的背景图像。
[0017]进一步,所述步骤3包括:
[0018]步骤31,对分割后的手势分析数据进行统计,得到手势数据的均值和方差的对应关系式,并确定所述均值和方差的取值范围,形成参考基准条件;
[0019]步骤32,选择分割后的手势目标数据,计算得到待调整的手势数据的方差S1和均值M1;
[0020]步骤33,从所述参考基准条件中随机选择一个手势数据的均值M2和方差S2,根据公式H2=(H1

M1)/S1*S2+M2逐点对待调整的手势数据的像素点的灰度值进行调整,若调整后的像素点的灰度值超出了阈值区间,则将像素点的灰度值赋值为最接近的阈值;
[0021]步骤34,通过重复步骤33或者步骤32和步骤33,对每一张分割后的手势目标数据的图像的像素点的灰度值进行调整,直至达到所述目标数量的待合成的手势目标图像。
[0022]进一步,所述手势数据的均值和方差的对应关系为max(0.28465*M+15.27581,0.1)≤S≤0.28465*M

25.27581,所述S为均值,M为方差。
[0023]进一步,所述步骤4中,在进行初始手势合成图像的合成过程中,待合成的手势目标图像在贴合时,含有手势目标图像可以在外围形成一个闭合的手势框,所述手势框在背景图像上的位置采用位置L表示,位置L为初始的手势合成图像的标注信息。
[0024]进一步,所述步骤5包括:
[0025]将所述初始合成图像构造为矩阵A,使所述初始手势合成图像与矩阵A的行列数相等;随机在不同的视场取该处的最大衰减值,按照与圆心的距离关系进行拟合,将初始手势合作图像和矩阵A的对应元素逐个相乘,从而拟合出镜头中不同位置的手势数据作为最终的手势合成数据。
[0026]进一步,将所述拟合出的镜头中不同位置的手势数据中随机加入散点噪音、直线噪音和曲线噪音当中的至少一种或其组合之后,再作为最终的手势合成数据。
[0027]本专利技术的手势数据集合的生成系统,采用上述技术方案所述的手势数据集合的生成方法得到手势合成数据,包括:
[0028]采集模块,用于采集所述原始图像;
[0029]预处理模块,对所述原始图像进行预处理;
[0030]调整模块,对预处理模块的处理结果进行调整处理;
[0031]合成模块,对待合成的手势目标数据和待合成的背景数据进行合成处理。
[0032]本专利技术的计算机可读存储介质,用来存储计算机程序,该计算机程序在运行时执
行上述技术方案所述的手势数据集合的生成方法得到手势合成数据。
[0033]本专利技术不需要投入大量的人力、物力和财力等资源就可以便捷快速地建立基于红外相机采集的手势数据集。通过红外相机采集到少量的IR图像数据,在经过预处理后分别得到手势目标数据、背景数据、以及所需要的调整基础参考条件,从而快速生成更多数量的手势目标数据,并与背景数据进行快速生成更多的原始手势合成数据,再经过后处理使得合成后的手势数据符合类似于实际采集的数据,同时还自动生成其标注信息,避免了标注的工作量,为深度学习提供较为充实的数据保障。相对于传统的方法,极大地提升了数据采集和标注效率,在较少的投入下就可以高效地获得所需要的训练数据集。
附图说明
[0034]下面结合实施例和附图对本专利技术进行详细说明,其中:
[0035]图1为本专利技术一实施例的流程图。
[0036]图2为本专利技术单一手势均值和方差的关系图。
[003本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种手势数据集合成的生成方法,其特征在于,包括:步骤1,利用红外相机采集原始图像,所述原始图像包括手势分析数据、手势目标数据和背景数据;步骤2,对原始图像进行预处理,得到分割后的手势分析数据、分割后的手势目标数据和待合成的背景数据;步骤3,根据分割后的手势分析数据对分割后的手势目标数据进行调整,生成目标数量的待合成的手势目标数据;步骤4,将待合成的手势目标数据和待合成的背景数据进行合成处理,获得初始手势合成图像。2.如权利要求1所述的手势数据集合的生成方法,其特征在于,还包括:步骤5,对初始合成图像进行后处理,获得最终的手势合成数据。3.如权利要求1所述的手势数据集合的生成方法,其特征在于,利用所述红外相机采集有效范围内不同距离、同视场内不同位置且空白背景的手势图像形成所述手势分析数据;和/或利用所述红外相机采集预设距离内、同视场内中心位置、不同单一角度且空白背景的手势图像形成所述手势目标数据;和/或利用所述红外相机采集有效范围内不含手势的各种场景的图像形成所述背景数据。4.如权利要求1所述的手势数据集合的生成方法,其特征在于,所述预处理包括对所述手势分析数据、手势目标数据进行数据转换使得原始图像的像素值满足阈值区间[0,255],和/或调整原始图像的大小,和/或对原始图像进行滤波、平滑、降噪处理当中的至少一种;和/或对所述背景数据进行旋转、裁剪、缩放、对比度调整、明暗度调整中的一种或组合操作,得到目标合成数量的待合成的背景图像。5.如权利要求1所述的手势数据集合的生成方法,其特征在于,所述步骤3包括:步骤31,对分割后的手势分析数据进行统计,得到手势数据的均值和方差的对应关系式,并确定所述均值和方差的取值范围,形成参考基准条件;步骤32,选择分割后的手势目标数据,计算得到待调整的手势数据的方差S1和均值M1;步骤33,从所述参考基准条件中随机选择一个手势数据的均值M...

【专利技术属性】
技术研发人员:全世红胡立天史伟兰
申请(专利权)人:深圳荆虹科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1