一种应用于医药识别的数据增强方法技术

技术编号：21434599 阅读：29 留言：0更新日期：2019-06-22 12:39

本发明专利技术公开了一种应用于医药识别的数据增强方法，包括如下方法：1.使用传统的数据增强技术对训练集中的图片做数据增强，得到新图片；2.构建生成对抗网络生成的新图片；3.使用替换背景颜色来做训练集图片的数据增强，保存下新的图片；4.将原始的训练集的图片与传统数据增强技术生成的新图片、生成对抗网络生成的新图片和背景色替换技术生成的新图片组合成训练样本送入中药材识别人工智能模型中进行训练。本发明专利技术生成的新图片与原始图片之间的相关性小，使用这种数据增强技术，能够达到拓展数据集目的的同时，避免传统数据增强技术可能带来的过拟合问题，使基于中药材图片数据集的人工智能模型具有更好的泛化能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种应用于医药识别的数据增强方法
本专利技术涉及一种数据增强方法，特别是涉及一种应用于医药识别的数据增强方法。
技术介绍
近年来，人工智能和大数据技术的高速发展，人工智能算法在中药材识别领域的应用也在不断普及。现有的人工智能技术，例如图像识别技术使用的是深度学习算法。深度神经网络参数众多，结构复杂，需要大量的样本来进行模型训练。汽车、人脸等常见事物可以从网络中获取大量的图片样本，但是中药材由于其特殊性，所有的图片样本都需要自己拍摄得到，因此样本数量通常会有所不足。数据增强是深度学习中常用的数据预处理方式，通过数据增强技术增加训练样本的数量可以很好的预防模型出现过拟合，从而提高模型的泛化能力。传统的数据增强技术例如：对原始图片镜像、随机翻转、平移变换、按特定比例缩放等。这些增强后的图片样本在初始阶段会有不错的效果，但因为本质上传统的数据增强技术产生的的新图片只是在原始图片上进行微小变化形成的，生成的图片和原始图片在某些局部包含的信息还是完全一致的，随着数据增强的不断继续，样本数量增加对提升模型的效果会越来越不明显。
技术实现思路
本专利技术的目的就是提供一种应用于医药识别的数据增强方法，能完全解决上述现有技术的不足之处。本专利技术的目的通过下述技术方案来实现：一种应用于医药识别的数据增强方法，包括如下方法：1）.将拍摄的中药材图片分为训练集和测试集，训练集用来训练模型，当训练集数量不足时，训练集做数据增强处理；测试集用来测试训练完后模型的泛化能力，测试集无需做数据增强处理，保持不变；2）.使用传统的数据增强技术对训练集中的图片做数据增强，得到新图片；3）.构建生...

【技术保护点】
1.一种应用于医药识别的数据增强方法，其特征在于，包括如下方法：1）.将拍摄的中药材图片分为训练集和测试集，训练集用来训练模型，当训练集数量不足时，训练集做数据增强处理；测试集用来测试训练完后模型的泛化能力，测试集无需做数据增强处理，保持不变；2）.使用传统的数据增强技术对训练集中的图片做数据增强，得到新图片；3）.构建生成对抗网络，对抗网络由生成模型和判别模型组成，生成模型用来生成新的图片，判别模型用来判断生成的新图片与原始图片是否同类；4）.使用替换背景颜色来做训练集图片的数据增强，首先将图片从RGB格式转变为HSV格式，取图片左上、右上、左下、右下4个顶点的像素值，根据这些像素值和HSV颜色区间像素阈值表，可以得到原始图片的背景颜色；设置此背景色的像素阈值区间，识别出整张图片中的背景区域，设定替换目标背景色的像素阈值，将背景区域内所有像素点的像素值均替换成目标背景色的阈值；将HSV格式的图片转换成RGB格式，保存下新的图片，完成背景色的替换；5）.将原始的训练集的图片与传统数据增强技术生成的新图片、生成对抗网络生成的新图片和背景色替换技术生成的新图片组合成训练样本送入中药材识别人工智能模型中进行训练。...

【技术特征摘要】
1.一种应用于医药识别的数据增强方法，其特征在于，包括如下方法：1）.将拍摄的中药材图片分为训练集和测试集，训练集用来训练模型，当训练集数量不足时，训练集做数据增强处理；测试集用来测试训练完后模型的泛化能力，测试集无需做数据增强处理，保持不变；2）.使用传统的数据增强技术对训练集中的图片做数据增强，得到新图片；3）.构建生成对抗网络，对抗网络由生成模型和判别模型组成，生成模型用来生成新的图片，判别模型用来判断生成的新图片与原始图片是否同类；4）.使用替换背景颜色来做训练集图片的数据增强，首先将图片从RGB格式转变为HSV格式，取图片左上、右上、左下、右下4个顶点的像素值，根据这些像素值和HSV颜色区间像素阈值表，可以得到原始图片的背景颜色；设置此背景色的像素阈值区间，识别出整张图片中的背景区域，设定替换目标背景色的像素阈值，将背景区域内所有像素点的像素值均替换成目标背景色的阈值...

【专利技术属性】
技术研发人员：袁杨，许慧，张群华，
申请(专利权)人：颐保医疗科技上海有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人