一种模型的训练方法、终端设备和存储介质技术

技术编号:28323688 阅读:28 留言:0更新日期:2021-05-04 13:04
本发明专利技术提供了一种模型的训练方法、终端设备和存储介质,其方法包括:对病灶图像进行图像扩充处理获得样本集;样本集包括预设数量个病灶图像样本;病灶图像样本具有人工标注;从样本集中随机剔除若干个病灶图像样本,将剔除样本后的样本集作为训练集;训练集中的病灶图像样本数目小于预设数量且大于预设数量的一半;提取训练集中病灶图像样本的病例特征,根据病例特征进行训练得到目标逻辑回归模型;对目标逻辑回归模型进行评价,根据评价结果训练得到病患识别模型。本发明专利技术在少量样本数据的情况下,训练得到高可靠性、高准确率的病患识别模型,提升诊断正确率,提高患者的生命安全。

【技术实现步骤摘要】
一种模型的训练方法、终端设备和存储介质
本专利技术涉及机器学习
,尤指一种模型的训练方法、终端设备和存储介质。
技术介绍
目前,在临床上超过70%的诊断都依赖于医学影像,包括超声、病理、内窥镜、CT(计算机断层成像)、CR(计算机X线摄影)、MRI(磁共振成像)等等多种手段;人工智能应用于医学影像主要是通过深度学习,实现机器对医学影像的分析判断,协助医生完成诊断,应用在疾病的筛查、诊断和治疗阶段。当前,医学影像辅助诊断被认为是人工智能最重要的潜在创新应用之一。医学影像医生缺口巨大,我国每年医学影像数据增长率约30%,而放射科医师数量年增长率仅为4%,且医师从业需要较长时间的学习和培训,这意味着影像科医师在未来处理影像数据的压力会越来越大,难以承担巨大的负荷。同时,随着分级诊疗政策的推进和基层医疗需求的释放,医学医学数据会增长更快,随之而来的放疗科/病理科医生缺乏的问题将更加严峻。医学影像数据几乎都是专业人员人工分析,其缺点也显而易见,即诊断误诊率高、效率低。据统计,美国每年误诊人数达到了1200万,中国每年误诊人数高达5700万。根据中华医学会的一份误诊资料显示,中国临床医疗误诊率为27.8%,其中恶性肿瘤平均误诊率为40%,器官异位误诊率为60%,肝结核、胃结核等肺外结核的平均误诊率也在40%以上。因此,运用医学影像对疾病进行诊断已经是现在普遍应用的辅助诊断方法,虽然医学影像的数据总量巨大,但是,由于医学病种繁多,而且,现在医疗信息孤岛的情况没有很好的解除,使得每一类特定疾病下的用于训练学习的样本总量不充足,导致训练出来的模型准确率不够,将导致误诊进而耽误患者及时治疗。
技术实现思路
本专利技术的目的是提供一种模型的训练方法、终端设备和存储介质,实现在少量样本数据的情况下,训练得到高可靠性、高准确率的病患识别模型,提升诊断正确率,提高患者的生命安全。本专利技术提供的技术方案如下:本专利技术提供一种模型的训练方法,包括步骤:对病灶图像进行图像扩充处理获得样本集;所述样本集包括预设数量个病灶图像样本;所述病灶图像样本具有人工标注;从所述样本集中随机剔除若干个病灶图像样本,将剔除样本后的样本集作为训练集;所述训练集中的病灶图像样本数目小于所述预设数量且大于所述预设数量的一半;提取所述训练集中病灶图像样本的病例特征,根据所述病例特征进行训练得到目标逻辑回归模型;对所述目标逻辑回归模型进行评价,根据评价结果训练得到病患识别模型。进一步的,所述对病灶图像进行图像扩充处理获得样本集包括步骤:获取人工标注标注后的病灶图像,并根据预设图像变换策略组合,对所述病灶图像进行变换处理完成图像扩充得到所述样本集。进一步的,所述提取所述训练集中病灶图像样本的病例特征,根据所述病例特征进行训练得到目标逻辑回归模型包括步骤:对所述训练集中的各病灶图像样本进行图像预处理,从预处理后的病灶图像样本中提取出图像特征作为所述病例特征;根据所述病例特征以及预先设置的训练参数进行训练得到逻辑回归模型,并将预先设置的验证集输入至所述逻辑回归模型中得到准确率值;若所述准确率值大于等于预设数值,将所述逻辑回归模型作为目标逻辑回归模型;若所述准确率值小于预设数值,获取新的训练集进行重训练直至获取到所述目标逻辑回归模型为止。进一步的,所述对所述目标逻辑回归模型进行评价,根据评价结果训练得到病患识别模型包括步骤:根据所述目标逻辑回归模型绘制得到接受者操作特征曲线,并计算获取所述接受者操作特征曲线下的目标面积;将所述目标面积与预设面积阈值进行比较得到评价结果;若所述评价结果为所述目标面积小于等于所述预设面积阈值,则确定所述目标逻辑回归模型不符合要求,获取新的训练集进行重训练;若所述评价结果为所述目标面积大于所述预设面积阈值,则确定所述目标逻辑回归模型为所述病患识别模型。本专利技术还提供一种终端设备,包括:样本扩充模块,用于对病灶图像进行图像扩充处理获得样本集;所述样本集包括预设数量个病灶图像样本;所述病灶图像样本具有人工标注;样本获取模块,用于从所述样本集中随机剔除若干个病灶图像样本,将剔除样本后的样本集作为训练集;所述训练集中的病灶图像样本数目小于所述预设数量且大于所述预设数量的一半;模型训练模块,用于提取所述训练集中病灶图像样本的病例特征,根据所述病例特征进行训练得到目标逻辑回归模型;模型确定模块,用于对所述目标逻辑回归模型进行评价,根据评价结果训练得到病患识别模型。进一步的,所述样本扩充模块包括:获取单元,用于获取人工标注后的病灶图像;扩充单元,用于根据预设图像变换策略组合,对所述病灶图像进行变换处理完成图像扩充得到所述样本集。进一步的,所述模型训练模块包括:提取单元,用于对所述训练集中的各病灶图像样本进行图像预处理,从预处理后的病灶图像样本中提取出图像特征作为所述病例特征;训练单元,用于根据所述病例特征以及预先设置的训练参数进行训练得到逻辑回归模型,并将预先设置的验证集输入至所述逻辑回归模型中得到准确率值;第一处理单元,用于若所述准确率值大于等于预设数值,将所述逻辑回归模型作为目标逻辑回归模型;若所述准确率值小于预设数值,获取新的训练集进行重训练直至获取到所述目标逻辑回归模型为止。进一步的,所述模型确定模块包括:计算单元,用于根据所述目标逻辑回归模型绘制得到接受者操作特征曲线,并计算获取所述接受者操作特征曲线下的目标面积;比较单元,用于将所述目标面积与预设面积阈值进行比较得到评价结果;第二处理单元,用于若所述评价结果为所述目标面积小于等于所述预设面积阈值,则确定所述目标逻辑回归模型不符合要求,获取新的训练集进行重训练;若所述评价结果为所述目标面积大于所述预设面积阈值,则确定所述目标逻辑回归模型为所述病患识别模型。本专利技术还提供一种存储介质,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现所述的模型的训练方法所执行的操作。通过本专利技术提供的一种模型的训练方法、终端设备和存储介质,能够在少量样本数据的情况下,训练得到高可靠性、高准确率的病患识别模型,提升诊断正确率,提高患者的生命安全。附图说明下面将以明确易懂的方式,结合附图说明优选实施方式,对一种模型的训练方法、终端设备和存储介质的上述特性、技术特征、优点及其实现方式予以进一步说明。图1是本专利技术一种模型的训练方法的一个实施例的流程图;图2是本专利技术一种模型的训练方法的另一个实施例的流程图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其他实施例中也可以实现本申请。在其他情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的本文档来自技高网
...

【技术保护点】
1.一种模型的训练方法,其特征在于,包括步骤:/n对病灶图像进行图像扩充处理获得样本集;所述样本集包括预设数量个病灶图像样本;所述病灶图像样本具有人工标注;/n从所述样本集中随机剔除若干个病灶图像样本,将剔除样本后的样本集作为训练集;所述训练集中的病灶图像样本数目小于所述预设数量且大于所述预设数量的一半;/n提取所述训练集中病灶图像样本的病例特征,根据所述病例特征进行训练得到目标逻辑回归模型;/n对所述目标逻辑回归模型进行评价,根据评价结果训练得到病患识别模型。/n

【技术特征摘要】
1.一种模型的训练方法,其特征在于,包括步骤:
对病灶图像进行图像扩充处理获得样本集;所述样本集包括预设数量个病灶图像样本;所述病灶图像样本具有人工标注;
从所述样本集中随机剔除若干个病灶图像样本,将剔除样本后的样本集作为训练集;所述训练集中的病灶图像样本数目小于所述预设数量且大于所述预设数量的一半;
提取所述训练集中病灶图像样本的病例特征,根据所述病例特征进行训练得到目标逻辑回归模型;
对所述目标逻辑回归模型进行评价,根据评价结果训练得到病患识别模型。


2.根据权利要求1所述的模型的训练方法,其特征在于,所述对病灶图像进行图像扩充处理获得样本集包括步骤:
获取人工标注后的病灶图像,并根据预设图像变换策略组合,对所述病灶图像进行变换处理完成图像扩充得到所述样本集。


3.根据权利要求1所述的模型的训练方法,其特征在于,所述提取所述训练集中病灶图像样本的病例特征,根据所述病例特征进行训练得到目标逻辑回归模型包括步骤:
对所述训练集中的各病灶图像样本进行图像预处理,从预处理后的病灶图像样本中提取出图像特征作为所述病例特征;
根据所述病例特征以及预先设置的训练参数进行训练得到逻辑回归模型,并将预先设置的验证集输入至所述逻辑回归模型中得到准确率值;
若所述准确率值大于等于预设数值,将所述逻辑回归模型作为目标逻辑回归模型;
若所述准确率值小于预设数值,获取新的训练集进行重训练直至获取到所述目标逻辑回归模型为止。


4.根据权利要求1-3任一项所述的模型的训练方法,其特征在于,所述对所述目标逻辑回归模型进行评价,根据评价结果训练得到病患识别模型包括步骤:
根据所述目标逻辑回归模型绘制得到接受者操作特征曲线,并计算获取所述接受者操作特征曲线下的目标面积;
将所述目标面积与预设面积阈值进行比较得到评价结果;
若所述评价结果为所述目标面积小于等于所述预设面积阈值,则确定所述目标逻辑回归模型不符合要求,获取新的训练集进行重训练;
若所述评价结果为所述目标面积大于所述预设面积阈值,则确定所述目标逻辑回归模型为所述病患识别模型。


5.一种终端设备,其特征在于,包括:
样本扩充模块,用于对病灶图像进行...

【专利技术属性】
技术研发人员:张发宝李欣梅
申请(专利权)人:上海梅斯医药科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1