一种基于数据收集与模拟的脑出血手术风险预测系统技术方案

技术编号:38970952 阅读:16 留言:0更新日期:2023-09-28 09:34
本发明专利技术公开了一种基于数据收集与模拟的脑出血手术风险预测系统,属于风险预测系统技术领域,包括:获取模块:用于获取包括手术风险标签的历史数据;生成模块:用于建立生成对抗网络模型,结合结构相似性指数,对历史数据进行数据增强,生成目标合成数据;提取模块:用于提取目标合成数据的特征数据,建立特征向量;构建模块:用于结合特征向量和手术风险标签,构建样本数据集;建立模块:用于利用训练集,建立手术风险预测模型;优化模块:用于引入生物启发式算法对手术风险预测模型进行超参数优化;第一预测模块:用于将测试集中样本输入至优化后的手术风险预测模型进行预测,输出预测结果,在预测结果准确率大于预设准确率的情况下,结束训练。结束训练。结束训练。

【技术实现步骤摘要】
一种基于数据收集与模拟的脑出血手术风险预测系统


[0001]本专利技术属于风险预测系统
,具体涉及一种基于数据收集与模拟的脑出血手术风险预测系统。

技术介绍

[0002]脑出血是一种严重的疾病,手术干预通常需要考虑患者的整体情况和风险。手术风险预测系统的应用可以帮助医生更好地了解患者的手术风险,从而做出更明智的手术决策,对于高风险患者,医生可能会选择保守治疗或其他替代治疗方式,以减少手术风险,而对于低风险患者,手术可能是更有效的治疗选择,因此,脑出血手术风险预测系统有助于优化患者的治疗方案,提高手术成功率,减少并发症发生率,同时降低不必要的手术风险和医疗成本。
[0003]目前,在手术之前的脑出血手术风险预测往往是根据医师主观判断,准确性低,对于已有的脑出血手术风险预测系统,由于患者数据需要严格保密,导致样本数据集获取困难,进而导致预测系统的训练不足,泛化能力和预测能力均不足,影响手术决策导致出现严重医疗事故。

技术实现思路

[0004]为了解决现有技术存在的在手术之前的脑出血手术风险预测往往是根据医师主观判断,准确性低,对于已有的脑出血手术风险预测系统,由于患者数据需要严格保密,导致样本数据集获取困难,进而导致预测系统的训练不足,泛化能力和预测能力均不足,影响手术决策导致出现严重医疗事故的技术问题,本专利技术提供一种基于数据收集与模拟的脑出血手术风险预测系统。
[0005] 本专利技术提供了一种基于数据收集与模拟的脑出血手术风险预测系统, 基于数据收集与模拟的脑出血手术风险预测系统包括:获取模块:用于获取包括手术风险标签的历史数据;生成模块:用于建立生成对抗网络模型,结合结构相似性指数,对历史数据进行数据增强,生成目标合成数据,其中,生成对抗网络模型包括关联的生成器和判别器;提取模块:用于提取目标合成数据中的特征数据,建立特征向量,其中,特征数据包括年龄、性别、病变位置、病变大小和术前状态;构建模块:用于结合特征向量和相对应的手术风险标签,构建样本数据集,其中,样本数据集包括训练集和测试集;建立模块:用于利用训练集,建立基于随机森林算法的手术风险预测模型;优化模块:用于引入生物启发式算法对手术风险预测模型进行超参数优化,其中,超参数包括决策树个数和最小叶子点数;第一预测模块:用于将测试集中的样本输入至优化后的手术风险预测模型进行预测,输出预测结果,在预测结果的准确率大于预设准确率的情况下,结束训练,其中,预测结
果包括高风险、中风险和低风险。
[0006]与现有技术相比,本专利技术至少具有以下有益技术效果:(1)在本专利技术中,通过建立生成对抗网络模型对获取的少量带标签历史数据进行数据增强,相比于普通的数据增强,生成对抗网络模型生成的合成图像是从随机噪声中生成的,可以产生与真实数据不同的样本,从而增加了样本的多样性,合成数据是通过对真实数据分布的建模来生成的,因此这些合成图像更接近真实数据的分布,提高手术风险预测模型的泛化能力,使其在实际情况下更好地适应真实数据。而且这种方式解决了因患者隐私导致的样本数据难以获取的情况。
[0007] (2)在本专利技术中,由于医学影像领域类别的数据比其他类别更少,导致数据不平衡问题,使用生成对抗网络模型生成合成数据可以增加少数类别的样本数量,有助于解决数据不平衡问题,提高模型对少数类别的预测能力。而且可以避免获取真实标签困难或昂贵的情况。使用生成对抗网络模型生成合成数据不需要真实标签,生成过程是无监督的,这降低了数据获取难度和获取成本。在获取真实标签困难的情况下,仍可以利用合成数据来增加训练样本,从而提高预测模型的自动化能力和泛化能力。
[0008] (3)在本专利技术中,可以对患者的原始电子病历进行脱敏处理,可以保障患者的电子病历在共享的过程中的信息安全,有效保护患者的隐私和敏感信息,降低数据泄露风险。
[0009] (4)在本专利技术中,通过建立包括多个决策树的随机森林,进而建立手术风险预测模型,融合了随机森林适用于数据集复杂性较高、特征之间相互影响较大的情况以及对训练样本要求不高的优点,提高模型预测准确率,减少过拟合。此外,本专利技术通过生物启发式算法对基于随机森林算法的手术风险预测模型中难以确定的超参数进行优化,避免直接进行超参数赋值导致的模型预测准确性不确定性大的情况,进一步提高模型泛化能力和预测准确性,提升预测客观性,降低手术事故率。
附图说明
[0010]下面将以明确易懂的方式,结合附图说明优选实施方式,对本专利技术的上述特性、技术特征、优点及其实现方式予以进一步说明。
[0011]图1是本专利技术提供的一种基于数据收集与模拟的脑出血手术风险预测系统的结构示意图。
具体实施方式
[0012]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对照附图说明本专利技术的具体实施方式。显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
[0013]为使图面简洁,各图中只示意性地表示出了与专利技术相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
[0014]还应当进一步理解,在本专利技术说明书和所附权利要求书中使用的术语“和/或”是
指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0015]在本文中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接。可以是机械连接,也可以是电连接。可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本专利技术中的具体含义。
[0016]另外,在本专利技术的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0017]在一个实施例中,参照图1,示出了本专利技术提供的一种基于数据收集与模拟的脑出血手术风险预测系统的结构示意图。
[0018] 本专利技术提供的一种基于数据收集与模拟的脑出血手术风险预测系统, 基于数据收集与模拟的脑出血手术风险预测系统包括:获取模块1:用于获取包括手术风险标签的历史数据。
[0019]其中,手术风险标签指的是与患者进行手术相关的风险评估标签,用于标识患者手术风险的程度,一般可分为高风险、中风险和低风险等级。手术风险标签的获取通常是通过医学专业人员对患者的临床资料和医学数据进行评估得出的,医学专业人员根据患者的病情、年龄、身体状况、病变位置、手术前的检查结果等多个因素来综合评估患者的手术风险水平,然后为患者打上相应的手术风险标签。历史数据指的是过去收集的患者的医学数据,包括脑出血病例的临床资料、手术前后的影像学数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数据收集与模拟的脑出血手术风险预测系统,其特征在于,包括:获取模块:用于获取包括手术风险标签的历史数据;生成模块:用于建立生成对抗网络模型,结合结构相似性指数,对所述历史数据进行数据增强,生成目标合成数据,其中,所述生成对抗网络模型包括关联的生成器和判别器;提取模块:用于提取所述目标合成数据中的特征数据,建立特征向量,其中,所述特征数据包括年龄、性别、病变位置、病变大小和术前状态;构建模块:用于结合所述特征向量和相对应的手术风险标签,构建样本数据集,其中,所述样本数据集包括训练集和测试集;建立模块:用于利用所述训练集,建立基于随机森林算法的手术风险预测模型;优化模块:用于引入生物启发式算法对所述手术风险预测模型进行超参数优化,其中,所述超参数包括决策树个数和最小叶子点数;第一预测模块:用于将所述测试集中的样本输入至优化后的手术风险预测模型进行预测,输出预测结果,在所述预测结果的准确率大于预设准确率的情况下,结束训练,其中,所述预测结果包括高风险、中风险和低风险。2.根据权利要求1所述的基于数据收集与模拟的脑出血手术风险预测系统,其特征在于,所述生成模块还用于:将所述手术风险标签与所述对抗网络模型的输入数据和输出数据进行联合;将随机噪声作为所述输入数据输入至联合后的对抗网络模型;输出一次合成数据;结合所述历史数据,通过所述判别器计算所述一次合成数据与所述历史数据的符合概率;以所述符合概率最小化为目标,固定判别器参数,对所述生成器进行训练,其中,所述生成器的目标函数具体为:;其中,表示所述生成器的目标函数,分别表示生成器参数和所述判别器参数,E表示数学期望值,F表示所述生成器,G表示所述判别器,pz表示历史数据分布,ph表示合成数据分布;以所述符合概率最大化为目标,固定所述生成器参数对所述判别器进行训练,所述判别器的目标函数具体为:;其中,表示所述判别器的目标函数;利用训练后的对抗网络模型生成二次合成数据;计算所述历史数据与所述二次合成数据的结构相似性指数:;其中,表示所述结构相似性指数,SSIM值越接近1表示两幅图像越相
似,SSIM值接近0表示两幅图像的结构相似程度较低,x,y分别表示所述历史数据和所述二次合成数据,分别表示所述历史数据和所述二次合成数据的图像亮度均值,分别表示所述历史数据和所述二次合成数据的图像亮度标准差,表示所述历史数据和所述二次合成数据之间的亮度协方差,C1和C2均为可调常数;在所述结构相似性指数大于预设指数的情况下,将所述二次合成数据作为目标合成数据输出。3.根据权利要求1所述的基于数据收集与模拟的脑出血手术风险预测系统,其特征在于,所述提取模块还用于:S1031:对所述目标合成数据进行预处理,其中,所述预处理包括数据清洗、去除异常值和缺失值填充;S1032:判断所述目标合成数据的数据类型,其中,所述数据类型包括结构化数据、文本数据和图像数据,在所述数据类型为结构化数据的情况下,进入S1033,在所述数据类型为文本数据的情况下,进入S1034,在所述数据类型为图像数据的情况下,进入S1035;S1033:直接从表格或者数据库中提取所述结构化数据;其中,所述结构化数据包括年龄和性别;S1034:通过自然语言处理算法对所述文本数据进行语义提取,其中,所述文本数据包括术前状态;S1035:通过图像分割算法提取所述图像数据,其中,所述图像数据包括病变位置和病变大小,所述图像分割算法包括阈值分割算法、区域生长算法和卷积神经网络算法;S1036:结合提取的数据,构建五维特征向量。...

【专利技术属性】
技术研发人员:赵呈进
申请(专利权)人:南通市康复医院南通市第二人民医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1