一种适用于深度学习训练数据的扩充增强方法、系统及可读存储介质技术方案

技术编号:32967663 阅读:28 留言:0更新日期:2022-04-09 11:27
本发明专利技术公开了一种适用于深度学习训练数据的扩充增强方法、系统及可读存储介质,所述扩充增强方法至少包括如下步骤:S1,获取原始训练数据,基于原始训练数据的射线能谱,通过数据分类模块对所述原始训练数据进行分类,其中,将具有相同特征能谱S

【技术实现步骤摘要】
一种适用于深度学习训练数据的扩充增强方法、系统及可读存储介质


[0001]本专利技术涉及数据增强
,尤其涉及一种适用于深度学习训练数据的扩充增强方法、系统及可读存储介质。

技术介绍

[0002]在医疗领域中应用神经网络最大的挑战就是缺乏大量已经标注的数据,采用大尺度的尽可能涵盖所有情况的训练集(large

scale datasets),可以提升模型泛化能力(generalizability),避免模型在遇到新数据时表现不足,但因为与自然图像数据集不同,医学影像数据集一般很小,主要原因是获得匿名准确标注的医学影像数据是很费事且困难的任务。同样,在放射治疗剂量计算中,也很难遍历获得所有不同强度及形状不同的剂量分布。因此采用有效的数据增强技术,弥补了训练集的“空白区域”,保证所训练模型具有泛化能力,适用多种条件,是影响深度学习在剂量计算中能否落地的关键。
[0003]现有在针对图像处理的深度学习训练中使用技术增强,技术有:1)切割(cropping)。根据输入数据矩阵大小,随机对原始数据进行切割,获得不同部分的数据本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种适用于深度学习训练数据的扩充增强方法,其特征在于,应用于与多个用户设备通信连接的数据训练服务器,所述扩充增强方法至少包括如下步骤:S1,获取原始训练数据,基于原始训练数据的射线能谱,通过数据分类模块(3)对所述原始训练数据进行分类,其中,将具有相同特征能谱S
k
的原始训练数据归为同一类;S2,通过第一数据训练模块(4),基于第一随机选取方式,从具有相同特征能谱S
k
的原始训练数据中选取N个第一数据,所述N个第一数据按照第一线性叠加的方式生成第一新数据;S3,通过第二数据训练模块(5),基于第二随机选取方式,从所述第一新数据中选取M个第二数据,所述M个数据按照第二线性叠加的方式生成第二新数据;S4,重复步骤S2和S3以生成训练样本。2.根据权利要求1所述的适用于深度学习训练数据的扩充增强方法,其特征在于,第一线性叠加方式至少包括如下步骤:S201,将随机抽取的N个数据分别命名为(T
1,k
,D
1,k
),(T
2,k
,D
2,k
)
……
(T
N,k
,D
N,k
);S202,所述N个数据基于第一叠加公式进行线性叠加以得到所述第一新数据(T

k
,D

k
),所述第一叠加公式为其中,T为训练集的输入数据,D为训练集的目标数据,c
i
为第一叠加比例,所述第一叠加比例c
i
为0~1之间的随机数,i为训练步数,所述第一叠加比例c
i
满足3.根据权利要求2所...

【专利技术属性】
技术研发人员:朱金汉陈立新
申请(专利权)人:广州瑞多思医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1