一种数据处理方法及非小细胞肺癌脑转移风险预测系统技术方案

技术编号:39244511 阅读:10 留言:0更新日期:2023-10-30 11:56
本申请公开了一种数据处理方法及非小细胞肺癌脑转移风险预测系统。该脑转移预测系统至少包括检测单元、模型筛选单元和风险预测单元。检测单元获取与非小细胞肺癌病灶相关的病理数据,并从中检测出目标基因数据,且检测单元还包括第一数据筛选子单元,适于确定出多个候选生物标记物数据。模型筛选单元利用多种候选预测模型分别对候选生物标记物数据进行处理以预测出风险值,并根据各候选预测模型的预测效果选取出预测模型。第一数据筛选子单元还利用预测模型,选取预定数目个候选生物标记物数据作为第一生物标记物数据。风险预测单元利用预测模型对第一生物标记物数据进行处理,输出风险值。本系统能够精准预测非小细胞肺癌的病灶脑转移。病灶脑转移。病灶脑转移。

【技术实现步骤摘要】
一种数据处理方法及非小细胞肺癌脑转移风险预测系统


[0001]本申请涉及计算机
,尤其涉及一种数据处理方法及非小细胞肺癌脑转移风险预测系统。

技术介绍

[0002]NSCLC(Non

Small Cell Lung Cancer,非小细胞肺癌)是肺癌的一种主要病理亚型,占据了大多数肺癌病例,主要包括肺腺癌、肺鳞癌和大细胞癌。NSCLC脑转移是指NSCLC肺癌细胞从原发灶(肺部)转移到大脑的现象。脑转移在NSCLC患者中相对常见,尤其在晚期或病程进展到严重阶段。据统计,大约20%至40%的NSCLC患者会在病程中发生脑转移。通常,脑转移发生的早期,患者基本没有特别的症状。在发生大规模脑转移之后,患者可能出现头痛、恶心、呕吐、癫痫发作、神经系统症状(如肢体无力、感觉异常、语言障碍)以及认知功能下降等症状。NSCLC脑转移的出现会严重影响患者的生活质量和日常功能。
[0003]多数情况下,若是能在脑转移早期进行干预治疗,能够提高存活率和控制疾病进展。而目前来说,由于症状出现晚且早期无症状,患者在发现脑转移的时候,往往病灶已经大量转移。
[0004]有鉴于此,需要一种能够对NSCLC脑转移进行精准预测的方案。

技术实现思路

[0005]本申请提供了一种数据处理方法及非小细胞肺癌脑转移风险预测系统,以力图解决或者至少缓解上面存在的至少一个问题。
[0006]根据本申请的一个方面,提供了一种数据处理方法,包括:获取与病灶相关的两组病理数据并分别从中检测出多种目标基因数据,其中两组病理数据包括病灶发生脑转移的第一病理数据和病灶在原位的第二病理数据,所述病灶指示非小细胞肺癌;至少通过对比分析第一病理数据和第二病理数据中每种目标基因数据的突变信息,确定出多个候选生物标记物数据,所述突变信息包括基因突变和拷贝数变异;利用多种候选预测模型分别对所述候选生物标记物数据进行处理以预测出风险值,并根据各所述候选预测模型的预测效果选取出预测模型;利用所述预测模型,选取预定数目个所述候选生物标记物数据,作为第一生物标记物数据;以及利用所述预测模型对所述第一生物标记物数据进行处理,以输出风险值,其中,所述风险值预测所述病灶存在预期风险的概率。
[0007]可选地,根据本申请的方法还包括:从所述第一病理数据中确定出至少一个第二生物标记物数据;利用所述预测模型对所述第一生物标记物数据和所述第二生物标记物数据进行处理,以输出所述风险值。
[0008]可选地,在根据本申请的方法中,从第一病理数据中确定出至少一个第二生物标记物数据,包括:从所述第一病理数据中提取一个或多个临床变量,并确定各临床变量与所述病灶发生预期风险的相关性;以及选取相关性高的临床变量,作为第二生物标记物数据。
[0009]可选地,在根据本申请的方法中,至少通过对比分析第一病理数据和第二病理数
据中每种目标基因数据的突变信息,确定出多个候选生物标记物数据,包括:分别确定所述第一病理数据和所述第二病理数据中,各目标基因数据的突变信息,作为各第一备选数据,其中,将第一病理数据中各第一备选数据作为第一数据集合,将第二病理数据中各第一备选数据作为第二数据集合;根据所述第一数据集合和所述第二数据集合中各第一备选数据的频率差,从所述第一备选数据中筛选出至少一个第一备选数据,作为第二备选数据;当所述第二备选数据在所述第一数据集合和所述第二数据集合中具有明显差异时,确定所述第二备选数据为候选生物标记物数据。
[0010]可选地,在根据本申请的方法中,当第二备选数据在第一数据集合和第二数据集合中具有明显差异时,确定所述第二备选数据为候选生物标记物数据,还包括:计算所述第一数据集合中的第二备选数据与所述第二数据集合中的第二备选数据的统计参数,并在所述统计参数满足预设条件时,确定所述第二备选数据在所述第一数据集合和所述第二数据集合中具有明显差异。
[0011]可选地,在根据本申请的方法中,至少通过对比分析第一病理数据和第二病理数据中每种目标基因数据的突变信息,确定出多个候选生物标记物数据,还包括:分别从所述第一病理数据和所述第二病理数据中获取肿瘤突变负荷,作为候选生物标记物数据。
[0012]可选地,在根据本申请的方法中,候选生物标记物数据至少包括:一个或多个目标基因数据的突变、一个或多个目标基因数据的拷贝数变异、肿瘤突变负荷。
[0013]可选地,在根据本申请的方法中,候选预测模型基于机器学习算法,以及所述根据各候选预测模型的预测效果选取出预测模型,包括:基于各候选预测模型输出的风险值,分别计算各候选预测模型的性能指标;选取性能指标值最大的候选预测模型,作为所述预测模型。
[0014]可选地,在根据本申请的方法中,利用预测模型,选取预定数目个候选生物标记物数据,作为第一生物标记物数据,包括:利用所述预测模型输出的风险值,计算各候选生物标记物数据对所述风险值的归因值;按照所述归因值从大到小的顺序,选取预定数目个候选生物标记物数据,作为第一生物标记物数据。
[0015]可选地,在根据本申请的方法中,第二生物标记物数据包括:确诊年龄,和/或,确诊时病灶是否发生骨骼转移。
[0016]根据本申请的再一方面,提供了一种非小细胞肺癌脑转移风险预测系统,包括:检测单元,适于获取与非小细胞肺癌病灶相关的病理数据,并从中检测出多种目标基因数据,其中病理数据包括病灶发生脑转移的第一病理数据、和病灶在原位的第二病理数据,并且,所述检测单元还包括:第一数据筛选子单元,适于至少通过对比分析所述第一病理数据和所述第二病理数据中每种目标基因数据的突变信息,确定出多个候选生物标记物数据,所述突变信息包括基因突变和拷贝数变异;模型筛选单元,适于利用多种候选预测模型分别对所述候选生物标记物数据进行处理以预测出风险值,并根据各所述候选预测模型的预测效果选取出预测模型;所述第一数据筛选子单元还适于利用所述预测模型,选取预定数目个所述候选生物标记物数据,作为第一生物标记物数据;风险预测单元,适于利用所述预测模型对所述第一生物标记物数据进行处理,以输出风险值,其中,所述风险值预测所述病灶存在预期风险的概率。
[0017]可选地,在根据本申请的系统中,检测单元还包括第二数据筛选子单元,适于从所
述第一病理数据中确定出至少一个第二生物标记物数据,包括:从所述第一病理数据中提取一个或多个临床变量,并确定各临床变量与所述病灶发生预期风险的相关性;选取相关性高的临床变量,作为第二生物标记物数据。
[0018]可选地,在根据本申请的系统中,风险预测单元还适于利用所述预测模型,对所述第一生物标记物数据和所述第二生物标记物数据进行处理,以输出所述风险值。
[0019]可选地,在根据本申请的系统中,第一数据筛选子单元还适于,分别确定所述第一病理数据和所述第二病理数据中,各目标基因数据的突变信息,作为各第一备选数据,其中,将第一病理数据中各第一备选数据作为第一数据集合,将第二病理数据中各第一备选数据作为第二数据集合;根据所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,包括:获取与病灶相关的两组病理数据并分别从中检测出多种目标基因数据,其中两组病理数据包括病灶发生脑转移的第一病理数据和病灶在原位的第二病理数据,所述病灶指示非小细胞肺癌;至少通过对比分析第一病理数据和第二病理数据中每种目标基因数据的突变信息,确定出多个候选生物标记物数据,所述突变信息包括基因突变和拷贝数变异;利用多种候选预测模型分别对所述候选生物标记物数据进行处理以预测出风险值,并根据各所述候选预测模型的预测效果选取出预测模型;利用所述预测模型,选取预定数目个所述候选生物标记物数据,作为第一生物标记物数据;以及利用所述预测模型对所述第一生物标记物数据进行处理,以输出风险值,其中,所述风险值预测所述病灶存在预期风险的概率。2.如权利要求1所述的方法,还包括:从所述第一病理数据中确定出至少一个第二生物标记物数据;利用所述预测模型对所述第一生物标记物数据和所述第二生物标记物数据进行处理,以输出所述风险值。3.如权利要求2所述的方法,其中,所述从第一病理数据中确定出至少一个第二生物标记物数据,包括:从所述第一病理数据中提取一个或多个临床变量,并确定各临床变量与所述病灶发生预期风险的相关性;以及选取相关性高的临床变量,作为第二生物标记物数据。4.如权利要求1

3中任一项所述的方法,其中,所述至少通过对比分析第一病理数据和第二病理数据中每种目标基因数据的突变信息,确定出多个候选生物标记物数据,包括:分别确定所述第一病理数据和所述第二病理数据中,各目标基因数据的突变信息,作为各第一备选数据,其中,将第一病理数据中各第一备选数据作为第一数据集合,将第二病理数据中各第一备选数据作为第二数据集合;根据所述第一数据集合和所述第二数据集合中各第一备选数据的频率差,从所述第一备选数据中筛选出至少一个第一备选数据,作为第二备选数据;当所述第二备选数据在所述第一数据集合和所述第二数据集合中具有明显差异时,确定所述第二备选数据为候选生物标记物数据。5.如权利要求4所述的方法,其中,所述当第二备选数据在第一数据集合和第二数据集合中具有明显差异时,确定所述第二备选数据为候选生物标记物数据,还包括:计算...

【专利技术属性】
技术研发人员:郑淑华吴祎林张博
申请(专利权)人:海南澳泰抚营贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1