一种用于人体运动识别的视频数据筛选方法技术

技术编号：37068716 阅读：29 留言：0更新日期：2023-03-29 19:46

本申请涉及一种用于人体运动识别的视频数据筛选方法，属于计算机视觉技术领域，包括输入视频、起始帧位以及末尾帧位；判断末尾帧位与起始帧位之差是否小于30帧；计算末尾帧与起始帧的相似度；判断相似度是否小于阈值；输出该视频还有无明显动作变化的视频段并结束；输入视频、起始帧位以及中间帧位；函数执行完毕，输入视频、中间帧位以及末尾帧位。本申请的优点在于可以自动化筛选存在无明显动作变化的视频，降低人力的投入，核心技术为衡量视频中两张图片的相似度，该技术可以保证尺度不变性和旋转不变性。性和旋转不变性。性和旋转不变性。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于人体运动识别的视频数据筛选方法

[0001]本专利技术涉及一种用于人体运动识别的视频数据筛选方法，属于计算机视觉

技术介绍

[0002]随着深度学习技术的发展，深度学习模型的参数和网络的层数越来越多，需要大量的数据和标签，来让模型进行拟合，模型最终的精度表现，强依赖于给定的训练数据；
[0003]现有技术中庞大的数据量依赖人工进行标注和筛选，需要大量的人力和时间。
[0004]例如：中国专利技术专利：CN201811489982.X，所公开的“数据筛选方法、装置、服务器及存储介质”，其说明书公开：对每个训练数据而言，需要准备10
‑
20个的标注数据，使得对数据标注投入的人力成本很大，并且由于人力资源有限，无法对尽可能多的数据进行人工标注，使得对海量的来自于互联网的原始数据利用不充分....；上述专利可以佐证现有技术存在的缺陷。
[0005]因此我们对此做出改进，提出一种用于人体运动识别的视频数据筛选方法。

技术实现思路

[0006]本专利技术要解决的技术问题是：庞大的数据量依赖人工进行标注和筛选，需要大量的人力和时间的问题。
[0007]为了实现上述专利技术目的，本专利技术提供了一种用于人体运动识别的视频数据筛选方法，包括：
[0008]步骤一、输入视频、起始帧位以及末尾帧位；
[0009]步骤二、判断末尾帧位与起始帧位之差是否小于30帧，当末尾帧位与起始帧位之差小于30帧时，则进行步骤三，反之则结束；
[00...

【技术保护点】

【技术特征摘要】
1.一种用于人体运动识别的视频数据筛选方法，其特征在于，包括：步骤一、输入视频、起始帧位以及末尾帧位；步骤二、判断末尾帧位与起始帧位之差是否小于30帧，当末尾帧位与起始帧位之差小于30帧时，则进行步骤三，反之则结束；步骤三、计算末尾帧与起始帧的相似度；步骤四、判断相似度是否小于阈值，当相似度小于阈值时，则进行步骤五，反之则进行步骤六；步骤五、输出该视频还有无明显动作变化的视频段并结束；步骤六、输入视频、起始帧位以及中间帧位，再次进行步骤二以及步骤七；步骤七、函数执行完毕，输入视频、中间帧位以及末尾帧位，再次进行步骤二；还包括：利用图像金字塔计算不同尺度下图片的余弦相似度；利用像素直方图中两两相邻的bin之间差值，重新构建图像直方图；利用尺度余弦相似度的平均值和新构建的图像直方图的乘积作为图像结构相似度量。2.根据权利要求1所述的一种用于人体运动识别的视频数据筛选方法，其特征在于，还包括核心算法，核心算法为计算一个视频段首尾两帧的相似度，SSIM结构性度量将整张图片用数量为像素个数的坐标表示一个向量，再将两张图像的代表向量计算余弦相似度。3.根据权利要求2所述的一种用于人体运动识别的视频数据筛选方法，其特征在于，利用图像金字塔计算不同尺度下图片的余弦相似度包括：利用下采样的方式生成图像的多尺度表达，通过4
×
4的滑动窗口将窗口内的像素值求平均，利用滑动窗口对图像的所有像素值执行求平均的操作，在像素不足4个的地方用零值进行填充；对480p视频中的帧采取7次下采样最终得到的顶层图片的分辨率为7
×
4，将彩色图片转换为灰度图片，使用如下公式进行转换：YH＝0.3R+0.59G+0.11B；其中，YH为灰度图片单通道像素值；R为彩色图片红色通道像素值；G为彩色图片绿色通道像素值；B为彩色图片蓝色通道像素值。4.根据权利要求3所述的一种用于人体运动识别的视频数据筛选方法，其特征在于，经过转换得到一组灰度图像来表征图像金字塔，计算两张图像在对应尺度上的余弦相似度。5.根据权利要求4所述的一种用于人体运动识别的视频数据筛选方法，其特征在于，计算不同尺度上的余弦相似度，计算公式如下：其中，i为第i个像素；x
i
代表该尺度下图片的第i个像素值；μ
x<...

【专利技术属性】
技术研发人员：张渊佳，陈金，李响，孟祥松，陈硕，张俊余，武文笛，
申请(专利权)人：天翼云科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人