一种肺结节发生肺癌风险的预测模型的构建方法技术

技术编号:36353598 阅读:13 留言:0更新日期:2023-01-14 18:09
本发明专利技术提供一种肺结节发生肺癌风险的预测模型的构建方法,包括:结合可疑肺结节人群的流行病学危险因素和LDCT筛查结节参数的数据信息,构建可疑性结节人群的结节库;通过单因素和多因素Cox回归分析,筛选得到6个肺癌发生的独立危险因子,同时将6个独立危险因子用于构建肺癌预测的列线图预测模型,并绘制列线图,再对构建的模型进行外部验证;基于列线图预测模型对可疑肺结节筛查者患肺癌可能性进行风险程度分层分析,验证列线图预测模型的预测效能;利用构建的列线图预测模型对可疑肺结节筛查者进行肺癌发生的预测,获得肺癌发生高危组和低危组;本发明专利技术能够减少LDCT筛查的假阳性率,提高肺癌预测的准确性。提高肺癌预测的准确性。提高肺癌预测的准确性。

【技术实现步骤摘要】
一种肺结节发生肺癌风险的预测模型的构建方法


[0001]本专利技术涉及数据分析
,尤其涉及一种肺结节发生肺癌风险的预测模型的构建方法。

技术介绍

[0002]肺癌(Lung cancer,LC)的发病率和死亡率持续位居首位,其发病率分别位居男、女性恶性肿瘤发病顺位的第一位和第二位(仅次于乳腺癌)。由于肺癌患者预后差,大部分肺癌患者初诊时已进展至晚期,我国肺癌五年发病率仅为19.7%。同时患者住院期间的诊治费用给社会和家庭带来了沉重的经济负担,这已成为重大的公共卫生问题。若肺癌患者能早期(Ⅰ期)发现并诊治,五年发病率将提高至77%~92%,能很大程度降低社会和家庭负担,有效改善患者生存质量。目前尚缺乏有效的肺癌筛查和早期诊断方法,患者能在早期得到诊治的比例非常低,仅为15%左右。因此,深入探索肺癌的早期筛查和诊断策略,对于控制其流行和减轻疾病负担具有重要的现实意义。
[0003]近年来,学术界涌现一系列肺癌早期筛查的研究,从最初胸片、痰细胞方法的提出,到X线胸片,再到低剂量螺旋CT(Low

dose spiral CT,LDCT)筛查方法的应用,经历了一个漫长的研究历程。有研究证据表明,LDCT筛查能降低死亡率。同时,有研究表明LDCT技术在我国社区肺癌高危人群中能有效发现早期肺癌。然而,LDCT在肺癌筛查应用中,通过识别可疑肺结节普遍存在假阳性率过高的不足之处。假阳性率过高势必引起筛查者不必要的精神紧张、过度诊疗而造成医疗资源的浪费和身体诊治创伤。
[0004]因此,亟需提供一种肺结节发生肺癌风险的预测模型的构建方法,能够有效的预测早期肺癌,且避免假阳性的筛查。

技术实现思路

[0005]本专利技术的主要目的是提供一种肺结节发生肺癌风险的预测模型的构建方法,克服上述不足,在减少假阳性的筛查的基础上,能够有效的预测早期肺癌。
[0006]为实现上述目的,本专利技术提供一种肺结节发生肺癌风险的预测模型的构建方法,包括:
[0007]结合可疑肺结节人群的流行病学危险因素和LDCT筛查结节参数的数据信息,构建可疑性结节人群的结节库;
[0008]通过单因素和多因素Cox回归分析可疑肺结节筛查者发生肺癌的风险因素,筛选得到6个肺癌发生的独立危险因子,同时将6个所述独立危险因子用于构建肺癌预测的列线图预测模型,并绘制列线图,再对构建的预测模型进行外部验证;6个所述独立危险因子分别为结节直径、结节密度、结节边缘、厨房油烟暴露、精神压抑史和高血压史;
[0009]基于所述列线图预测模型对可疑肺结节筛查者患肺癌可能性进行风险程度分层分析,验证列线图预测模型的预测效能;利用构建的列线图预测模型对可疑肺结节筛查者进行肺癌发生的预测,获得肺癌发生高危组和低危组。
[0010]作为上述方案进一步的改进,获取可疑肺结节人群的流行病学危险因素的步骤包括:
[0011]选择符合条件的筛查人群,进行肺癌高危评估危险因素调查问卷,并将调查问卷的信息输入风险评估系统获得个体的患癌风险指数;
[0012]所述危险因素调查问卷包括但不限于了参加者基本信息、生活的环境、饮食的习惯、生活方式和生活习惯、癌症家族史、心理与情绪、主要既往史、女性生理及生育史等;
[0013]其中,与肺癌评估相关的因素包括:吸烟指数、日常平均新鲜蔬菜摄入量、长期生活环境空气污染、日常体育锻炼情况、慢性呼吸系统疾病史、肺癌家族史、被动吸烟史。
[0014]作为上述方案进一步的改进,在获取LDCT筛查结节参数的数据信息前,还需要通过个体癌症风险的评估模型初步判断参加者是否为肺癌高危人群,具体的,通过国家癌症中心构建的信息系统中存储的评估模型,初步判断参加者是否为肺癌高危人群。
[0015]作为上述方案进一步的改进,若被初步判断为肺癌高危人群,则对所述肺癌高危人群进行低剂量螺旋CT筛查,获得肺癌高危人群结节的每个结节的位置、密度、大小、边缘和性质,并判断结节的种类以及是否为阳性,并出具筛查人员对应的LDCT筛查记录表;
[0016]然后根据低剂量螺旋CT筛查结果建立肺癌高危者低剂量螺旋CT筛查队列并进行随访,并对筛查人员的随访信息进行记录。
[0017]作为上述方案进一步的改进,所述肺癌预测的列线图诊断模型的建立方法如下:
[0018]对可疑肺结节人群以6:4的比例随机分为建模组和验证组,建模组中,用K

M法绘制所有变量的生存曲线,并通过log

rank检验方法进行统计学比较分析;
[0019]单因素比较分析之后,P值小于0.1的变量进行Cox回归分析,所述回归模型以最小信息准则(Akaike information criterion,AIC)逐步向后方法筛查变量;
[0020]确定进入预测模型的变量包括结节直径、结节密度、结节边缘、厨房油烟暴露、精神压抑史和高血压史。
[0021]作为上述方案进一步的改进,所述绘制列线图的方法如下:
[0022]S1:获取回归系数:通过Cox逐步回归分析,将结节直径、结节密度、结节边缘、厨房油烟暴露、精神压抑史和高血压史六个变量进入所述预测模型获得变量的回归系数及其赋值;
[0023]S2:回归系统转换:对回归系数做转化后通过图形的形式展示,根据各变量的系数和赋值范围转换为对应的数值;
[0024]S3:对步骤S2中转换结果赋分并计算各个变量的总得分;
[0025]S4:绘制发病率标尺:根据Cox回归模型计算得出1年或3年或5年的无病发病概率;根据总得分标尺绘制相应的发病概率标尺。
[0026]作为上述方案进一步的改进,所述步骤S2中,回归系数转换的转换公式为:
[0027]Nomogram
结节直径(≥15mm vs 5

8mm)
=2.54
×
(2

1)≈2.54
[0028]Nomogram
结节直径(8

15mm vs 5

8mm)
=1.46
×
(2

1)≈1.46
[0029]Nomogram
结节密度(部分实性vs实性)
=0.24
×
(2

1)≈0.24
[0030]Nomogram
结节密度(非实性vs实性)


1.58(2

1)≈

1.58
[0031]Nomogram
结节边缘


1.21
×
(1

0)≈

1.21
[0032]Nomogram
厨房油烟暴露
=0.87
×
(1

0)≈0.87
[0033]Nomog本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种肺结节发生肺癌风险的预测模型的构建方法,其特征在于,包括:结合可疑肺结节人群的流行病学危险因素和LDCT筛查结节参数的数据信息,构建可疑性结节人群的结节库;通过单因素和多因素Cox回归分析可疑肺结节筛查者发生肺癌的风险因素,筛选得到6个肺癌发生的独立危险因子,同时将6个所述独立危险因子用于构建肺癌预测的列线图预测模型,并绘制列线图,再对构建的预测模型进行外部验证;6个所述独立危险因子分别为结节直径、结节密度、结节边缘、厨房油烟暴露、精神压抑史和高血压史;基于所述列线图预测模型对可疑肺结节筛查者患肺癌可能性进行风险程度分层分析,验证列线图预测模型的预测效能;利用构建的列线图预测模型对可疑肺结节筛查者进行肺癌发生的预测,获得肺癌发生高危组和低危组。2.根据权利要求1所述的一种肺结节发生肺癌风险的预测模型的构建方法,其特征在于,获取可疑肺结节人群的流行病学危险因素的步骤包括:选择符合条件的筛查人群,进行肺癌高危评估危险因素调查问卷,并将调查问卷的信息输入风险评估系统获得个体的患癌风险指数;所述危险因素调查问卷包括参加者基本信息、生活的环境、饮食的习惯、生活方式和生活习惯、癌症家族史、心理与情绪、主要既往史、女性生理及生育史;其中,与肺癌评估相关的因素包括:吸烟指数、日常平均新鲜蔬菜摄入量、长期生活环境空气污染、日常体育锻炼情况、慢性呼吸系统疾病史、肺癌家族史、被动吸烟史。3.根据权利要求1或2所述的一种肺结节发生肺癌风险的预测模型的构建方法,其特征在于,在获取LDCT筛查结节参数的数据信息前,还需要通过个体癌症风险的评估模型初步判断参加者是否为肺癌高危人群。4.根据权利要求3所述的一种肺结节发生肺癌风险的预测模型的构建方法,其特征在于,若被初步判断为肺癌高危人群,则对所述肺癌高危人群进行低剂量螺旋CT筛查,获得肺癌高危人群结节的每个结节的位置、密度、大小、边缘和性质,并判断结节的种类以及是否为阳性,同时出具筛查人员对应的LDCT筛查记录表;然后根据低剂量螺旋CT筛查结果建立肺癌高危者低剂量螺旋CT筛查队列并进行随访,并对筛查人员的随访信息进行记录。5.根据权利要求4所述的一种肺结节发生肺癌风险的预测模型的构建方法,其特征在于,所述肺癌预测的列线图预测模型的建立方法如下:对可疑肺结节人群以6:4的比例随机分为建模组和验证组,建模组中,用K

M法绘制所有变量的生存曲线,并通过log

rank检验方法进行统计学比较分析;单因素比较分析之后,P值小于0.1的变量进行Cox回归分析,所述回归模型以最小信息准则逐步向后方法筛查变量;确定进入预测模型的变量包括结节直径、结节密度、结节边缘、厨房油烟暴露、精神压抑史和高血压史。6.根据权利要求5所述的一种肺结节发生肺癌风险的预测模型的构建方法,其特征在于,所述绘制列线图的绘制方法如下:S1:获取回归系数:通过Cox逐步回归分析,将结节直径、结节密度、结节边缘、厨房油烟暴露、精神压抑史和高血压史六个变量进入所述预测模型获得变量的回归系数及其赋值;
S2:回归系统转换:对回归系数做...

【专利技术属性】
技术研发人员:肖海帆
申请(专利权)人:湖南省肿瘤医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1