【技术实现步骤摘要】
一种基于深度学习的数据增强方法
本专利技术属于人工智能深度学习
,尤其是涉及一种基于深度学习的数据增强方法。
技术介绍
随着社会的进步与发展,深度学习已经在图像,文字语音等各个领域变为主流的技术。在文字翻译,对话机器人,语音识别,人脸识别,人脸支付等都有着重大应用潜力。而在图像领域,随着近年来的深度学习快速发展以及人工智能芯片算力的提升,很多图像算法都用到了深度学习技术,比如目前先进的人脸识别基本上都用到了深度学习。在图像深度学习有两个关键因素,其一是训练数据,其二是模型的结构。而最终效果的呈现取决于两者的有机结合,本专利技术想要解决的问题集中在第一个关键因素,即:图像训练数据的获得。众所周知,图训练数据的获得取决于算法的应用场景。比如人脸识别和人脸检测模型需要用现实生活中的真实人脸。但是考虑实际情况下,获得真实数据会受到种种因素的制约,比如用户隐私,政策法规等。而数据取得的难易程度也会导致样本分布不均衡,某些类别样本多,某些样本类别少,这样不均衡的样本会降低的泛化能力。即便是能够获得相应的数据,数据集太小也没 ...
【技术保护点】
1.一种基于深度学习的数据增强方法,其特征在于,包括:/nS1、设训练样本需要的目标样本数为N,设定容忍度k,把所有样本数量大于N-k的样本加入模型,训练变分自编码机;/nS2、用训练好的自编码机对于大于N-k并且小于N的样本生成特征向量,对这些特征向量进行SMOT插值,用插值之后的特征生成图片样本;这样大于N-k并且小于N的样本已经生成完毕,满足数量等于N的要求;/nS3、设定k=2*k,即下一次把所有样本数量大于N-2*k的样本放入模型训练自编码机;/nS4、我们重复步骤S1-S3,直至所有样本满足等于N的要求。/n
【技术特征摘要】
1.一种基于深度学习的数据增强方法,其特征在于,包括:
S1、设训练样本需要的目标样本数为N,设定容忍度k,把所有样本数量大于N-k的样本加入模型,训练变分自编码机;
S2、用训练好的自编码机对于大于N-k并且小于N的样本生成特征向量,对这些特征向量进行SMOT插值,用插值之后的特征生成图片样本;这样大于N-k并且小于N的样本已经生成完毕,满足数量等于N的要求;
S3、设定k=2*k,即下一次把所有样本数量大于N-2*k的样本放入模型训练自编码机;
S4、我们重复步骤S1-S3,直至所有样本满足等于N的要求。
2.根据权利要求1所述的基于深度学习的数据增强方法,其特征在于:所述自编码机包括前后两部分,前部分为编码器,输入是图像,输出是特征向量;后部分为解码器,输入是特征向量,输出是图像;
执行步骤S2、S3时,利用步骤...
【专利技术属性】
技术研发人员:张钦海,王思俊,张云飞,王志保,姜伟,
申请(专利权)人:天津天地伟业智能安全防范科技有限公司,
类型:发明
国别省市:天津;12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。