一种深度学习样本增强系统及其运行方法技术方案

技术编号：18238170 阅读：129 留言：0更新日期：2018-06-17 01:36

本发明专利技术公开了一种深度学习样本增强系统，包括：录制并提供视频序列的视频模块、从视频序列中获取优化的SSD网络的检测器、包括已标注数据的原始样本的样本模块、对视频序列抽样检测并进行统计分析的采样模块、筛选模块、标注模块；同时本发明专利技术还公开了深度学习样本增强系统的运行方法。通过深度学习样本增强系统，自动选取训练样本，增强训练样本的多样性、复杂性，减少训练样本的冗余度，提升算法的训练效果和泛化能力；而且本发明专利技术的深度学习样本增强系统的运行方法在不进行算法层面的优化的基础上，可以直接大幅提升模型效果，同时减少图像标注的无效工作量。 1

A deep learning sample enhancement system and its operation method

The present invention discloses a depth learning sample enhancement system, including video module for recording and providing video sequence, detector for obtaining optimized SSD network from video sequence, sample module including original samples of labeled data, sampling module for sampling detection of video sequence and sampling module for statistical analysis, Shai Xuanmo The invention also discloses the operation method of the deep learning sample enhancement system. Through the depth learning sample enhancement system, the training sample is automatically selected, the diversity and complexity of the training samples are enhanced, the redundancy of the training samples is reduced, the training effect and generalization ability of the algorithm are improved, and the operation method of the depth learning sample enhancement system of the invention is based on the optimization without the algorithm level. It can directly improve the effectiveness of the model and reduce the invalid workload of image annotation. One

全部详细技术资料下载

【技术实现步骤摘要】
一种深度学习样本增强系统及其运行方法
本专利技术所述的技术方案属于深度学习领域，本专利技术涉及一种深度学习样本增强系统及其运行方法。
技术介绍
目前，深度学习算法因其参数量巨大，需要大量的训练样本才能让算法训练收敛，如果样本量不足时，需要使用迁移学习的方式，基于别的大数据样本上训练出来的模型，用自已的数据进行Finetune。样本在深度学习算法中的作用至关重要，样本的数量、质量、多样性、复杂性等等都直接关系到算法最终训练模型能否有一个好的测试效果、是否有很强的泛化能力而不是过拟合。已有的深度学习框架如Caffe等，自身会提供一些样本增强的方法如随机裁切、随机扩展、随机镜像、随机颜色变换等，但这些方法都是在已有的数据集上进行样本增强，可以增加样本的数量，和一定程度地增加样本的多样性，减缓样本的冗余性，但是不能从根本上去增加样本的复杂性、去除样本的冗余性，也不能解决样本的不均衡性问题，过度依赖这些增强技术会导致训练过拟合。SSD(SingleShotDetection)是一种端对端一步到位、效果优异、速度快的目标检测算法，可用于实时的视频目标检测，但原版SSD对小目标的检测效果不好。在安防领域目标检测的实际应用中，训练样本图像来源主要是各种监控视频，由于监控布置的摄像头数目巨大(一个城市就有上万路的视频),可从这些视频中采集到大量样本进行标注，并用于训练。但是如果使用人工的方式主观、随机地从各路视频中去选取视频帧作为样本，势必导致样本集充满随机不确定性，很难采样到最好的样本分布，并且工作量巨大。
技术实现思路
为解决现有技术的不足，本专利技术提供一种深度学习样本增...
一种深度学习样本增强系统及其运行方法

【技术保护点】
1.一种深度学习样本增强系统，其特征在于，其包括：

【技术特征摘要】
1.一种深度学习样本增强系统，其特征在于，其包括：视频模块，录制并提供视频序列；检测器，检测器从视频序列中获取优化的SSD网络；样本模块，样本模块中包括已标注数据的原始样本，用原始样本训练优化后的SSD网络，得到检测模型及其在固定测试集上的平均精度均值；统计样本模块中的样本分布数据，得到样本筛选规则；采样模块，采样模块利用检测模型对视频序列进行抽样检测，并对抽样检测结果进行统计分析；筛选模块，筛选模块按照样本模块中得到样本筛选规则对所有视频抽样检测的统计分析结果进行排序，选取至少两张排序后的图像作为新样本；标注模块，通过人工精确标注新样本，并将标注后的新样本加入样本模块中。2.权利要求1所述的深度学习样本增强系统的运行方法，其特征在于，包括以下步骤：步骤一：对SSD网络进行优化，获得优化后的SSD网络；步骤二：采用原始样本训练优化后的SSD网络，得到检测模型及其在固定测试集上的平均精度均值；统计原始样本的样本分布数据，得到样本筛选规则；步骤三：用检测模型对视频序列进行抽样检测，对抽样检测结果进行统计分析，并按照筛选规则对统计分析结果进行排序，选取至少两帧排序后的图像作为新样本；步骤四：标注新样本，新样本与原始样本共同形成最终训练...

【专利技术属性】
技术研发人员：杜俊珑，晋兆龙，邹文艺，
申请(专利权)人：苏州科达科技股份有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人