一种用于人体运动识别的视频数据筛选方法技术

技术编号:37068716 阅读:29 留言:0更新日期:2023-03-29 19:46
本申请涉及一种用于人体运动识别的视频数据筛选方法,属于计算机视觉技术领域,包括输入视频、起始帧位以及末尾帧位;判断末尾帧位与起始帧位之差是否小于30帧;计算末尾帧与起始帧的相似度;判断相似度是否小于阈值;输出该视频还有无明显动作变化的视频段并结束;输入视频、起始帧位以及中间帧位;函数执行完毕,输入视频、中间帧位以及末尾帧位。本申请的优点在于可以自动化筛选存在无明显动作变化的视频,降低人力的投入,核心技术为衡量视频中两张图片的相似度,该技术可以保证尺度不变性和旋转不变性。性和旋转不变性。性和旋转不变性。

【技术实现步骤摘要】
一种用于人体运动识别的视频数据筛选方法


[0001]本专利技术涉及一种用于人体运动识别的视频数据筛选方法,属于计算机视觉


技术介绍

[0002]随着深度学习技术的发展,深度学习模型的参数和网络的层数越来越多,需要大量的数据和标签,来让模型进行拟合,模型最终的精度表现,强依赖于给定的训练数据;
[0003]现有技术中庞大的数据量依赖人工进行标注和筛选,需要大量的人力和时间。
[0004]例如:中国专利技术专利:CN201811489982.X,所公开的“数据筛选方法、装置、服务器及存储介质”,其说明书公开:对每个训练数据而言,需要准备10

20个的标注数据,使得对数据标注投入的人力成本很大,并且由于人力资源有限,无法对尽可能多的数据进行人工标注,使得对海量的来自于互联网的原始数据利用不充分....;上述专利可以佐证现有技术存在的缺陷。
[0005]因此我们对此做出改进,提出一种用于人体运动识别的视频数据筛选方法。

技术实现思路

[0006]本专利技术要解决的技术问题是:庞大的数据量依赖人工进行标注和筛选,需要大量的人力和时间的问题。
[0007]为了实现上述专利技术目的,本专利技术提供了一种用于人体运动识别的视频数据筛选方法,包括:
[0008]步骤一、输入视频、起始帧位以及末尾帧位;
[0009]步骤二、判断末尾帧位与起始帧位之差是否小于30帧,当末尾帧位与起始帧位之差小于30帧时,则进行步骤三,反之则结束;
[0010]步骤三、计算末尾帧与起始帧的相似度;
[0011]步骤四、判断相似度是否小于阈值,当相似度小于阈值时,则进行步骤五,反之则进行步骤六;
[0012]步骤五、输出该视频还有无明显动作变化的视频段并结束;
[0013]步骤六、输入视频、起始帧位以及中间帧位,再次进行步骤二以及步骤七;
[0014]步骤七、函数执行完毕,输入视频、中间帧位以及末尾帧位,再次进行步骤二;
[0015]还包括:
[0016]利用图像金字塔计算不同尺度下图片的余弦相似度;
[0017]利用像素直方图中两两相邻的bin之间差值,重新构建图像直方图;
[0018]利用尺度余弦相似度的平均值和新构建的图像直方图的乘积作为图像结构相似度量。
[0019]本专利技术所提供的一种用于人体运动识别的视频数据筛选方法,其有益效果是:
[0020]1.本申请的优点在于可以自动化筛选存在无明显动作变化的视频,降低人力的投
入,核心技术为衡量视频中两张图片的相似度,该技术可以保证尺度不变性和旋转不变性;
[0021]2.利用图像金字塔计算不同尺度下图片的余弦相似度、利用像素直方图中两两相邻的bin之间差值,重新构建图像直方图、利用尺度余弦相似度的平均值和新构建的图像直方图的乘积作为图像结构相似度量,解决了解决由传统的SSIM相似性度量法无法鉴别尺度不同以及发生旋转的两张图片的相似性,完成在多个视频中筛选无明显动作变化的视频。
附图说明
[0022]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0023]图1为本申请提供的用于人体运动识别的视频数据筛选方法的流程示意图;
[0024]图2为本申请提供的图像金字塔的示意图;
[0025]图3为本申请提供的计算两张图像在对应尺度上的余弦相似度的计算过程图;
[0026]图4为本申请提供的利用余弦相似度的平均值代表多尺度下图片的相似度的示意图;
[0027]图5为本申请提供的像素直方图进行改进过程示意图。
具体实施方式
[0028]下面结合说明书附图和实施例,对本专利技术的具体实施方式做进一步详细描述。以下实施例仅用于说明本专利技术,但不能用来限制本专利技术的范围。
[0029]实施例1:
[0030]如图1所示,本实施方式提出一种用于人体运动识别的视频数据筛选方法,包括:
[0031]步骤一、输入视频、起始帧位以及末尾帧位;
[0032]步骤二、判断末尾帧位与起始帧位之差是否小于30帧,当末尾帧位与起始帧位之差小于30帧时,则进行步骤三,反之则结束;
[0033]步骤三、计算末尾帧与起始帧的相似度;
[0034]步骤四、判断相似度是否小于阈值,当相似度小于阈值时,则进行步骤五,反之则进行步骤六;
[0035]步骤五、输出该视频还有无明显动作变化的视频段并结束;
[0036]步骤六、输入视频、起始帧位以及中间帧位,再次进行步骤二以及步骤七;
[0037]步骤七、函数执行完毕,输入视频、中间帧位以及末尾帧位,再次进行步骤二;
[0038]还包括:
[0039]利用图像金字塔计算不同尺度下图片的余弦相似度;
[0040]利用像素直方图中两两相邻的bin之间差值,重新构建图像直方图;
[0041]利用尺度余弦相似度的平均值和新构建的图像直方图的乘积作为图像结构相似度量。
[0042]实施例2:
[0043]下面结合具体的工作方式对实施例1中的方案进行进一步的介绍,详见下文描述:
[0044]作为优选的实施方式,在上述方式的基础上,进一步的,还包括核心算法,核心算法为计算一个视频段首尾两帧的相似度,SSIM结构性度量将整张图片用数量为像素个数的坐标表示一个向量,再将两张图像的代表向量计算余弦相似度;
[0045]实施例3:
[0046]下面结合具体的工作方式对实施例1和实施例2中的方案进行进一步的介绍,详见下文描述:
[0047]作为优选的实施方式,在上述方式的基础上,进一步的,利用图像金字塔计算不同尺度下图片的余弦相似度包括:
[0048]面对尺度和旋转发生变化的条件下,需要寻找一种更为稳定的向量表示方法,使得代表图片结构的向量发生很小的改变,在针对尺度变化方面,需要寻找向量的多尺度表达,利用下采样的方式生成图像的多尺度表达,通过4
×
4的滑动窗口将窗口内的像素值求平均,利用滑动窗口对图像的所有像素值执行求平均的操作,在像素不足4个的地方用零值进行填充;
[0049]对480p视频中的帧采取7次下采样最终得到的顶层图片的分辨率为7
×
4,将彩色图片转换为灰度图片,使用如下公式进行转换:
[0050]YH=0.3R+0.59G+0.11B;
[0051]其中,YH为灰度图片单通道像素值;R为彩色图片红色通道像素值;G为彩色图片绿色通道像素值;B为彩色图片蓝色通道像素值。
[0052]如图2和图3所示,作为优选的实施方式,在上述方式的基础上,进一步的,经过转换得到一组灰度图像来表征图像金本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于人体运动识别的视频数据筛选方法,其特征在于,包括:步骤一、输入视频、起始帧位以及末尾帧位;步骤二、判断末尾帧位与起始帧位之差是否小于30帧,当末尾帧位与起始帧位之差小于30帧时,则进行步骤三,反之则结束;步骤三、计算末尾帧与起始帧的相似度;步骤四、判断相似度是否小于阈值,当相似度小于阈值时,则进行步骤五,反之则进行步骤六;步骤五、输出该视频还有无明显动作变化的视频段并结束;步骤六、输入视频、起始帧位以及中间帧位,再次进行步骤二以及步骤七;步骤七、函数执行完毕,输入视频、中间帧位以及末尾帧位,再次进行步骤二;还包括:利用图像金字塔计算不同尺度下图片的余弦相似度;利用像素直方图中两两相邻的bin之间差值,重新构建图像直方图;利用尺度余弦相似度的平均值和新构建的图像直方图的乘积作为图像结构相似度量。2.根据权利要求1所述的一种用于人体运动识别的视频数据筛选方法,其特征在于,还包括核心算法,核心算法为计算一个视频段首尾两帧的相似度,SSIM结构性度量将整张图片用数量为像素个数的坐标表示一个向量,再将两张图像的代表向量计算余弦相似度。3.根据权利要求2所述的一种用于人体运动识别的视频数据筛选方法,其特征在于,利用图像金字塔计算不同尺度下图片的余弦相似度包括:利用下采样的方式生成图像的多尺度表达,通过4
×
4的滑动窗口将窗口内的像素值求平均,利用滑动窗口对图像的所有像素值执行求平均的操作,在像素不足4个的地方用零值进行填充;对480p视频中的帧采取7次下采样最终得到的顶层图片的分辨率为7
×
4,将彩色图片转换为灰度图片,使用如下公式进行转换:YH=0.3R+0.59G+0.11B;其中,YH为灰度图片单通道像素值;R为彩色图片红色通道像素值;G为彩色图片绿色通道像素值;B为彩色图片蓝色通道像素值。4.根据权利要求3所述的一种用于人体运动识别的视频数据筛选方法,其特征在于,经过转换得到一组灰度图像来表征图像金字塔,计算两张图像在对应尺度上的余弦相似度。5.根据权利要求4所述的一种用于人体运动识别的视频数据筛选方法,其特征在于,计算不同尺度上的余弦相似度,计算公式如下:其中,i为第i个像素;x
i
代表该尺度下图片的第i个像素值;μ
x<...

【专利技术属性】
技术研发人员:张渊佳陈金李响孟祥松陈硕张俊余武文笛
申请(专利权)人:天翼云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1