System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于人工智能的肺癌存活率预测模型的搭建方法及系统技术方案_技高网

基于人工智能的肺癌存活率预测模型的搭建方法及系统技术方案

技术编号:41196740 阅读:3 留言:0更新日期:2024-05-07 22:25
本申请公开了一种基于人工智能的肺癌存活率预测模型的搭建方法及系统,主要涉及预测模型搭建技术领域,用以解决现有的肺癌模型在训练时通常基于多种类型的数据集进行建模,导致模型在面对具体数据时给出的结果较为宽泛的问题。包括:获得初始样本数据;通过初始样本数据训练预设深度学习算法以获得初始深度学习模型;通过预设特征确定界面,确定影响肺癌存活率的关键因子和当前患者的基础信息;进而从初始训练数据中提取关键因子对应的处理数据;基于基础信息,从处理数据中提取最终训练数据;将最终训练数据导入初始深度学习模型进行二次学习,以获得训练好的深度学习模型,进而通过训练好的深度学习模型,获得当前患者对应的预测数据。

【技术实现步骤摘要】

本申请涉及预测模型的搭建,尤其涉及一种基于人工智能的肺癌存活率预测模型的搭建方法及系统


技术介绍

1、随着大数据和人工智能技术的快速发展,其在医疗健康领域的应用日益广泛。随着医疗信息化的发展,医院积累了大量的患者数据,包括结构化的电子病历和检查报告以及非结构化的病理图像和ct/mri影像资料等。肺癌作为一种高发病率和高死亡率的恶性肿瘤,其存活率预测对于治疗方案的选择和患者生活质量的改善具有重要意义。

2、现有的预测模型的搭建方案有:一种肺癌生存期预测模型训练、预测方法、系统、装置及介质,包括以下步骤:获取多个患者的肺癌数据,其中,肺癌数据包括患者治疗前的肺部ct影像、临床治疗信息和患者的预后生存期标签;根据绿色治疗方法的条件对多个肺癌数据进行筛选和预处理得到多个初始化肺癌数据;保存多个初始化肺癌数据得到训练数据集;初始化肺癌生存期预测模型的参数;将训练数据集输入到初始化后的肺癌生存期预测模型中进行训练,得到训练好的肺癌生存期预测模型。

3、但是,上述方案主要集中在大数据处理过程中,肺癌模型在训练时通常基于多种类型的数据集进行建模,这可能导致模型在面对具体数据时,给出的结果较为宽泛。


技术实现思路

1、针对现有技术的上述不足,本申请提供一种基于人工智能的肺癌存活率预测模型的搭建方法及系统,以解决现有的肺癌模型在训练时通常基于多种类型的数据集进行建模,导致模型在面对具体数据时给出的结果较为宽泛的问题。

2、第一方面,本申请提供了一种基于人工智能的肺癌存活率预测模型的搭建方法,方法包括:通过医院业务系统,收集肺癌患者对应的结构化数据;通过图像采集装置,采集肺癌患者对应的非结构化数据;构建数据处理程序,以对结构化数据进行数据清洗,将清洗后的结构化数据中的预设隐私数据处理为掩码,以获得第一数据;从非结构化数据中提取预设关键特征对应的具体数值,以获得第二数据;将第一数据和第二数据组合为初始样本数据;通过初始样本数据训练预设深度学习算法以获得初始深度学习模型;通过预设特征确定界面,确定影响肺癌存活率的关键因子和当前患者的基础信息;进而从初始训练数据中提取关键因子对应的处理数据;基于基础信息,从处理数据中提取最终训练数据;其中,基本信息至少包括:吸烟史、二手烟吸入情况、常住城市的空气污染指数、职业信息;将最终训练数据导入初始深度学习模型进行二次学习,以获得训练好的深度学习模型,进而通过训练好的深度学习模型,获得当前患者对应的预测数据。

3、进一步地,结构化数据至少包括:患者的基本信息、电子病历、检查报告、治疗记录、饮食记录和睡眠记录;非结构化数据至少包括:病理图像、ct/mri影像图片。

4、进一步地,在通过医院业务系统,收集肺癌患者对应的结构化数据之前,方法还包括:构建患者数据获取小程序,以采集患者上传的饮食记录;其中,患者数据获取小程序包含图片识别子程序和文字获取子程序;通过图片识别子程序中的图片识别算法,将采集的饮食图片和饮食时间转换为文字形式的饮食记录;或通过文字获取子程序获取文字形式的饮食记录;在获取到饮食记录后,基于预设饮食推荐数据库,生成饮食健康程度分析报告;其中,饮食健康程度分析报告中至少包括:当前饮食记录中是否存在病情有害食品、饮食食品推荐。

5、进一步地,二手烟吸入情况包含存在二手烟吸入情况和不存在二手烟吸入情况,职业信息包含具体职业和接触致肺癌物质的风险指数;基于基础信息,从处理数据中提取最终训练数据,具体包括:确定基础信息对应的提取范围;其中,提取范围具体为与当前吸烟史的绝对值差值小于预设吸烟阈值,且与当前二手烟吸入情况相同,且与当前空气污染指数的绝对值差值小于预设污染阈值,且与当前职业信息中的接触致肺癌物质的风险指数的绝对值差值小于预设风险阈值的范围;从处理数据中提取满足提取范围的数据作为最终训练数据。

6、进一步地,在通过训练好的深度学习模型,获得当前患者对应的预测数据之后,方法还包括:通过预设数据展示界面,展示数据处理流程,其中,数据处理流程包含:初始样本数据图标、预设深度学习算法图标、初始深度学习模型图标、影响肺癌存活率的关键因子图标、当前患者的基础信息图标、最终训练数据图标、训练好的深度学习模型图标和预测数据图标;且任一图标均为超链接图标,点击超链接图标后,能够弹出对应的具体数据;且数据处理流程中包含根据预设数据顺序生成的图标之间的指向箭头。

7、进一步地,关键因子至少包括:检查报告中的肺癌种类;从初始训练数据中提取关键因子对应的处理数据,具体包括:通过关键字提取算法从初始训练数据中提取关键因子对应的处理数据。

8、第二方面,本申请提供了一种基于人工智能的肺癌存活率预测模型的搭建系统,系统包括:数据采集模块,用于通过医院业务系统,收集肺癌患者对应的结构化数据;通过图像采集装置,采集肺癌患者对应的非结构化数据;初始模型获得模块,用于构建数据处理程序,以对结构化数据进行数据清洗,将清洗后的结构化数据中的预设隐私数据处理为掩码,以获得第一数据;从非结构化数据中提取预设关键特征对应的具体数值,以获得第二数据;将第一数据和第二数据组合为初始样本数据;通过初始样本数据训练预设深度学习算法以获得初始深度学习模型;训练数据筛选模块,用于通过预设特征确定界面,确定影响肺癌存活率的关键因子和当前患者的基础信息;进而从初始训练数据中提取关键因子对应的处理数据;基于基础信息,从处理数据中提取最终训练数据;其中,基本信息至少包括:吸烟史、二手烟吸入情况、常住城市的空气污染指数、职业信息;模型确定模块,用于将最终训练数据导入初始深度学习模型进行二次学习,以获得训练好的深度学习模型,进而通过训练好的深度学习模型,获得当前患者对应的预测数据。

9、进一步地,结构化数据包括饮食记录;数据采集模块包括用户端数据处理单元,用于构建患者数据获取小程序,以采集患者上传的饮食记录;其中,患者数据获取小程序包含图片识别子程序和文字获取子程序;通过图片识别子程序中的图片识别算法,将采集的饮食图片和饮食时间转换为文字形式的饮食记录;或通过文字获取子程序获取文字形式的饮食记录;在获取到饮食记录后,基于预设饮食推荐数据库,生成饮食健康程度分析报告;其中,饮食健康程度分析报告中至少包括:当前饮食记录中是否存在病情有害食品及饮食食品推荐。

10、进一步地,二手烟吸入情况包含存在二手烟吸入情况和不存在二手烟吸入情况,职业信息包含具体职业和接触致肺癌物质的风险指数;训练数据筛选模块包括数据确定单元,用于确定基础信息对应的提取范围;其中,提取范围具体为与当前吸烟史的绝对值差值小于预设吸烟阈值,且与当前二手烟吸入情况相同,且与当前空气污染指数的绝对值差值小于预设污染阈值,且与当前职业信息中的接触致肺癌物质的风险指数的绝对值差值小于预设风险阈值的范围;从处理数据中提取满足提取范围的数据作为最终训练数据。

11、进一步地,系统还包括处理过程可视化模块,用于通过预设数据展示界面,展示数据处理流程,其中,数据处理流程包含本文档来自技高网...

【技术保护点】

1.一种基于人工智能的肺癌存活率预测模型的搭建方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于人工智能的肺癌存活率预测模型的搭建方法,其特征在于,结构化数据至少包括:患者的基本信息、电子病历、检查报告、治疗记录、饮食记录和睡眠记录;

3.根据权利要求2所述的基于人工智能的肺癌存活率预测模型的搭建方法,其特征在于,在通过医院业务系统,收集肺癌患者对应的结构化数据之前,所述方法还包括:

4.根据权利要求1所述的基于人工智能的肺癌存活率预测模型的搭建方法,其特征在于,二手烟吸入情况包含存在二手烟吸入情况和不存在二手烟吸入情况,职业信息包含具体职业和接触致肺癌物质的风险指数;

5.根据权利要求1所述的基于人工智能的肺癌存活率预测模型的搭建方法,其特征在于,在通过训练好的深度学习模型,获得当前患者对应的预测数据之后,所述方法还包括:

6.根据权利要求1所述的基于人工智能的肺癌存活率预测模型的搭建方法,其特征在于,关键因子至少包括:检查报告中的肺癌种类;

7.一种基于人工智能的肺癌存活率预测模型的搭建系统,其特征在于,所述系统包括:

8.根据权利要求7所述的基于人工智能的肺癌存活率预测模型的搭建系统,其特征在于,结构化数据包括饮食记录;数据采集模块包括用户端数据处理单元,

9.根据权利要求7所述的基于人工智能的肺癌存活率预测模型的搭建系统,其特征在于,二手烟吸入情况包含存在二手烟吸入情况和不存在二手烟吸入情况,职业信息包含具体职业和接触致肺癌物质的风险指数;

10.根据权利要求7所述的基于人工智能的肺癌存活率预测模型的搭建系统,其特征在于,所述系统还包括处理过程可视化模块,

...

【技术特征摘要】

1.一种基于人工智能的肺癌存活率预测模型的搭建方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于人工智能的肺癌存活率预测模型的搭建方法,其特征在于,结构化数据至少包括:患者的基本信息、电子病历、检查报告、治疗记录、饮食记录和睡眠记录;

3.根据权利要求2所述的基于人工智能的肺癌存活率预测模型的搭建方法,其特征在于,在通过医院业务系统,收集肺癌患者对应的结构化数据之前,所述方法还包括:

4.根据权利要求1所述的基于人工智能的肺癌存活率预测模型的搭建方法,其特征在于,二手烟吸入情况包含存在二手烟吸入情况和不存在二手烟吸入情况,职业信息包含具体职业和接触致肺癌物质的风险指数;

5.根据权利要求1所述的基于人工智能的肺癌存活率预测模型的搭建方法,其特征在于,在通过训练好的深度学习模型,获得当前...

【专利技术属性】
技术研发人员:李凤荣林文丛金剑金洪殿李策王钰单保涛
申请(专利权)人:北方健康医疗大数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1