一种减少视频数据集用于人工智能训练时冗余的方法技术

技术编号：28710569 阅读：16 留言：0更新日期：2021-06-05 23:59

本发明专利技术公开了一种减少视频数据集用于人工智能训练时冗余的方法，包括如下步骤：1)将视频文件逐帧解析成图像文件，解析时使用检测算法进行图像模糊度检测；2)读取步骤1处理后的第一张图像保存为临时变量；3)读取下一张图像与临时变量使用相似度对比算法进行相似度对比；4)遍历步骤3中保留的图像文件，按顺序逐一与其他剩余图像进行相似度对比，如果相似度对比值高于阈值，则保留被对比图像，否则将对比图像进行删除操作。本发明专利技术属于互联网技术领域，具体是指一种可以有效降低视频数据用于人工智能模型训练时冗余性的方法。工智能模型训练时冗余性的方法。工智能模型训练时冗余性的方法。

全部详细技术资料下载

【技术实现步骤摘要】
一种减少视频数据集用于人工智能训练时冗余的方法

[0001]本专利技术属于互联网
，具体是指一种减少视频数据集用于人工智能训练时冗余的方法。

技术介绍

[0002]随着移动互联网的快速发展和网络摄像头应用的普及，数字社交、数字工业等数字经济领域内视频数据逐步代替图像数据作为信息载体，从以往的单张图像变成动态的视频。视频相对于图像更具全面性和有效性，可以帮助人们更直观地理解其中内容含义。但是，视频是由时间维度上多张连续图像组合而成，因此，当其作为人工智能算法训练阶段的数据源时会存在大量信息冗余。这些冗余不仅会极大地降低人工智能模型训练时的效率，而且也会加大数据标注时所花费的时间成本和人力成本，同时也不利于人工智能模型泛化能力的提升

技术实现思路

[0003]为了解决上述难题，本专利技术提供了一种减少视频数据集用于人工智能训练时冗余的方法。
[0004]为实现上述目的，本专利技术采取的技术方案如下：一种减少视频数据集用于人工智能训练时冗余的方法，包括如下步骤：
[0005]1)将视频文件逐帧解析成图像文件，解析时使用检测算法进行图像模糊度检测，设定模糊值阈值，如果高于设定阈值则认为该帧图像为清晰图像，进行本地存储，图像文件名称按照视频帧数顺序进行命名；
[0006]如果低于或等于设定阈值则认为该帧图像为模糊图像，进行删除操作；
[0007]2)读取步骤1处理后的第一张图像保存为临时变量；
[0008]3)读取下一张图像与临时变量使用相似度对比算法进行相似度对比...

【技术保护点】

【技术特征摘要】
1.一种减少视频数据集用于人工智能训练时冗余的方法，其特征在于，包括如下步骤：1)将视频文件逐帧解析成图像文件，解析时使用检测算法进行图像模糊度检测，设定模糊值阈值，如果高于设定阈值则认为该帧图像为清晰图像，进行本地存储，图像文件名称按照视频帧数顺序进行命名；如果低于或等于设定阈值则认为该帧图像为模糊图像，进行删除操作；2)读取步骤1处理后的第一张图像保存为临时变量；3)读取下一张图像与临时变量使用相似度对比算法进行相似度对比，设定相似度对比阈值，如果该张图像与临时变量的相似度对比值高于设定阈值，则认为两者差异较大，将该张图像保存并赋值到临时变量；如果该...

【专利技术属性】
技术研发人员：陈轶，张文，牛少彰，崔浩亮，王茂森，王让定，冯亚辉，
申请(专利权)人：东南数字经济发展研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人