一种模型的训练方法、终端设备和存储介质技术

技术编号：28323688 阅读：28 留言：0更新日期：2021-05-04 13:04

本发明专利技术提供了一种模型的训练方法、终端设备和存储介质，其方法包括：对病灶图像进行图像扩充处理获得样本集；样本集包括预设数量个病灶图像样本；病灶图像样本具有人工标注；从样本集中随机剔除若干个病灶图像样本，将剔除样本后的样本集作为训练集；训练集中的病灶图像样本数目小于预设数量且大于预设数量的一半；提取训练集中病灶图像样本的病例特征，根据病例特征进行训练得到目标逻辑回归模型；对目标逻辑回归模型进行评价，根据评价结果训练得到病患识别模型。本发明专利技术在少量样本数据的情况下，训练得到高可靠性、高准确率的病患识别模型，提升诊断正确率，提高患者的生命安全。

全部详细技术资料下载

【技术实现步骤摘要】
一种模型的训练方法、终端设备和存储介质
本专利技术涉及机器学习
，尤指一种模型的训练方法、终端设备和存储介质。
技术介绍
目前，在临床上超过70％的诊断都依赖于医学影像，包括超声、病理、内窥镜、CT(计算机断层成像)、CR(计算机X线摄影)、MRI(磁共振成像)等等多种手段；人工智能应用于医学影像主要是通过深度学习，实现机器对医学影像的分析判断，协助医生完成诊断，应用在疾病的筛查、诊断和治疗阶段。当前，医学影像辅助诊断被认为是人工智能最重要的潜在创新应用之一。医学影像医生缺口巨大，我国每年医学影像数据增长率约30％，而放射科医师数量年增长率仅为4％，且医师从业需要较长时间的学习和培训，这意味着影像科医师在未来处理影像数据的压力会越来越大，难以承担巨大的负荷。同时，随着分级诊疗政策的推进和基层医疗需求的释放，医学医学数据会增长更快，随之而来的放疗科/病理科医生缺乏的问题将更加严峻。医学影像数据几乎都是专业人员人工分析，其缺点也显而易见，即诊断误诊率高、效率低。据统计，美国每年误诊人数达到了1200万，中国每年误诊人数高达5700万。根据中华医学会的一份误诊资料显示，中国临床医疗误诊率为27.8％，其中恶性肿瘤平均误诊率为40％，器官异位误诊率为60％，肝结核、胃结核等肺外结核的平均误诊率也在40％以上。因此，运用医学影像对疾病进行诊断已经是现在普遍应用的辅助诊断方法，虽然医学影像的数据总量巨大，但是，由于医学病种繁多，而且，现在医疗信息孤岛的情况没有很好的解除，使得每一类特定疾病下的用于训...

【技术保护点】
1.一种模型的训练方法，其特征在于，包括步骤：/n对病灶图像进行图像扩充处理获得样本集；所述样本集包括预设数量个病灶图像样本；所述病灶图像样本具有人工标注；/n从所述样本集中随机剔除若干个病灶图像样本，将剔除样本后的样本集作为训练集；所述训练集中的病灶图像样本数目小于所述预设数量且大于所述预设数量的一半；/n提取所述训练集中病灶图像样本的病例特征，根据所述病例特征进行训练得到目标逻辑回归模型；/n对所述目标逻辑回归模型进行评价，根据评价结果训练得到病患识别模型。/n

【技术特征摘要】
1.一种模型的训练方法，其特征在于，包括步骤：
对病灶图像进行图像扩充处理获得样本集；所述样本集包括预设数量个病灶图像样本；所述病灶图像样本具有人工标注；
从所述样本集中随机剔除若干个病灶图像样本，将剔除样本后的样本集作为训练集；所述训练集中的病灶图像样本数目小于所述预设数量且大于所述预设数量的一半；
提取所述训练集中病灶图像样本的病例特征，根据所述病例特征进行训练得到目标逻辑回归模型；
对所述目标逻辑回归模型进行评价，根据评价结果训练得到病患识别模型。

2.根据权利要求1所述的模型的训练方法，其特征在于，所述对病灶图像进行图像扩充处理获得样本集包括步骤：
获取人工标注后的病灶图像，并根据预设图像变换策略组合，对所述病灶图像进行变换处理完成图像扩充得到所述样本集。

3.根据权利要求1所述的模型的训练方法，其特征在于，所述提取所述训练集中病灶图像样本的病例特征，根据所述病例特征进行训练得到目标逻辑回归模型包括步骤：
对所述训练集中的各病灶图像样本进行图像预处理，从预处理后的病灶图像样本中提取出图像特征作为所述病例特征；
根据所述病例特征以及预先设置的训练参数进行训练得到逻辑回归模型，并将预先设置的验证集输入至所述逻辑回归模型中得到准确率值；
若所述准确率值大于等于预设数值，将所述逻辑回归模型作为目标逻辑回归模型；
若所述准确率值小于预设数值，获取新的训练集进行重训练直至获取到所述目标逻辑回归模型为止。

4.根据权利要求1-3任一项所述的模型的训练方法，其特征在于，所述对所述目标逻辑回归模型进行评价，根据评价结果训练得到病患识别模型包括步骤：
根据所述目标逻辑回归模型绘制得到接受者操作特征曲线，并计算获取所述接受者操作特征曲线下的目标面积；
将所述目标面积与预设面积阈值进行比较得到评价结果；
若所述评价结果为所述目标面积小于等于所述预设面积阈值，则确定所述目标逻辑回归模型不符合要求，获取新的训练集进行重训练；
若所述评价结果为所述目标面积大于所述预设面积阈值，则确定所述目标逻辑回归模型为所述病患识别模型。

5.一种终端设备，其特征在于，包括：
样本扩充模块，用于对病灶图像进行...

【专利技术属性】
技术研发人员：张发宝，李欣梅，
申请(专利权)人：上海梅斯医药科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人