System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于污染物暴露评价领域,尤其涉及一种空气污染物个体暴露浓度评估方法和装置。
技术介绍
1、环境中污染物的浓度对评估人群的健康影响至关重要,空气污染物的暴露测量误差长期以来一直被认为是空气污染流行病学研究的局限性之一,既往的流行病学研究一般倾向于使用最近的固定监测站的空气污染物浓度来代表研究对象的暴露水平。然而,环境中空气污染物的浓度与个体空气污染物暴露相比仍存在一定的差异,这表明来自固定监测站的空气污染物浓度可能不足以代替调查对象的个体暴露。因此,在流行病学研究中,使用固定监测站数据直接代替个体暴露数据的方法可能导致较大的预测误差,甚至可能会导致预测无效。因此,建立个体暴露与环境暴露之间的关联是值得研究且具有重要意义的,如何准确评估个体空气污染物暴露对于减少流行病学研究中的暴露测量误差至关重要。
2、队列研究是流行病学调查中一种重要的研究设计,分析健康效应时队列研究有足够的统计学能力,并且队列研究能够反映目标人群的异质性。然而,队列研究中空气污染暴露的评估需要花费较高的成本和资源,所以空气污染预测模型常常被用作暴露评估的一种解决方案。先前的队列研究中通过预测模型拟合作为个体空气污染物暴露的一种替代方式。但是,这些建模方法需要测量室内污染物并观察住房特征,这很难应用于大样本量的调查,而且现有大多数评估个体暴露的模型在使用时往往需要输入复杂的模型参数,这也导致其很难在大样本量的研究(如队列)中使用和推广。
3、最近有研究在小规模人群中建立了个体暴露评估模型,为更先进的建模方法提供了初步基础。这些研究
4、为了尽量解决上述缺点,必须对现有的预测模型拟合方法进行改进。
5、基于以上,本申请提供了解决以上技术问题的技术方案。
技术实现思路
1、针对现有技术中个体空气污染物暴露预测的技术空白,本专利技术提供了一种空气污染物个体暴露浓度评估方法,包括以下步骤:
2、步骤1、获取大样本人群数据信息,并根据随机原则将所述大样本人群数据信息分为第一数据集合和第二数据集合;
3、步骤2、基于第一数据集合和第二数据集合,构建大样本人群空气污染物个体暴露浓度初步模型;
4、步骤3、训练所述大样本人群空气污染物个体暴露浓度初步模型,得到大样本人群空气污染物个体暴露浓度预测模型,并基于所述大样本人群空气污染物个体暴露浓度预测模型进行敏感性分析,并获得对预测结果影响最大的因素贡献度及各影响因素贡献度排序;
5、步骤4、基于所述大样本人群空气污染物个体暴露浓度预测模型,根据第二数据集合对人群进行空气污染物个体暴露浓度预测,获得模型预测数据,并将第二数据集合的结果数据与所述模型预测数据进行比较,评估预测模型的准确性;
6、步骤5、将目标人群数据输入所述人群空气污染物个体暴露浓度预测模型,评估目标人群个体暴露浓度数据结果,实现对目标人群个体暴露情况的预测。
7、在本专利技术的一个具体实施方式中,所述第一数据集合为训练集数据,第二数据集合为验证集数据。
8、在本专利技术的一个具体实施方式中,所述大样本人群空气污染物个体暴露浓度初步模型与人群空气污染物个体暴露浓度预测模型均基于随机森林模型。
9、在本专利技术的一个具体实施方式中,步骤1还包括:
10、步骤1.1、基于网格搜索,对大样本人群数据信息进行多阶段的交叉验证;其中,每个交叉验证阶段均包括分裂尝试的变量数和树数,通过特征重要性评估选取最终的参数。
11、在本专利技术的一个具体实施方式中,步骤3还包括:
12、步骤3.1、通过bland-altman方法评估所述人群空气污染物个体暴露浓度预测模型;
13、步骤3.2、通过一致限度的配对测量的数量测试所述人群空气污染物个体暴露浓度预测模型预测的性能。
14、在本专利技术的一个具体实施方式中,步骤3还包括:
15、步骤3.3、将所述验证集数据应用于所述人群空气污染物个体暴露浓度预测模型中,基于线性回归评估数据的拟合结果。
16、在本专利技术的一个具体实施方式中,步骤4还包括:
17、步骤4.1、比较空气污染物个体实际暴露浓度数值与空气污染物室外实际暴露浓度数值,得到第一比较结果;
18、步骤4.2、比较所述人群空气污染物个体暴露浓度预测模型输出的预测个体暴露浓度数据与大样本人群空气污染物个体暴露浓度预测模型输出的预测暴露浓度数据,得到第二比较结果;
19、步骤4.3、根据第一比较结果与第二比较结果验证人群空气污染物个体暴露浓度预测模型的准确性。
20、在本专利技术的一个具体实施方式中,所述第一比较结果为空气污染物个体实际暴露浓度数值与空气污染物室外实际暴露浓度的第一比值;第二比较结果为所述人群空气污染物个体暴露浓度预测模型输出的预测个体暴露浓度数据与大样本人群空气污染物个体暴露浓度预测模型输出的预测暴露浓度数据的第二比值。
21、在本专利技术的一个具体实施方式中,将未采样目标人群的数据信息,导入所述人群空气污染物个体暴露浓度预测模型,得到未采样目标人群的空气污染物个体暴露浓度评估结果。
22、本专利技术还提供一种空气污染物个体暴露浓度评估装置,包括:
23、数据获取模块,用于获取大样本人群数据信息,并根据随机原则将所述大样本人群数据信息分为第一数据集合和第二数据集合;
24、第一模型构建模块,用于基于第一数据集合和第二数据集合,构建大样本人群空气污染物个体暴露浓度初步模型;
25、训练分析模块,用于训练所述大样本人群空气污染物个体暴露浓度初步模型,得到大样本人群空气污染物个体暴露浓度预测模型,并基于所述大样本人群空气污染物个体暴露浓度预测模型进行敏感性分析,并获得对预测结果影响最大的因素贡献度及各影响因素贡献度排序;
26、第一预测模块,用于基于所述大样本人群空气污染物个体暴露浓度预测模型,根据第二数据集合对人群进行空气污染物个体暴露浓度预测,获得模型预测数据,并将第二数据集合的结果数据与所述模型预测数据进行比较,评估预测模型的准确性;
27、第二预测模块,将未采样目标人群数据输入所述人群空气污染物个体暴露浓度预测模型,评估目标人群个体暴露浓度数据结果,实现对未采样目标人群个体暴露情况的预测。
28、本专利技术能够带来以下至少一种有益效果:
29、1、本专利技术提供的空气污染物个体暴露浓度评估方法可以良好地拟合非线性关本文档来自技高网...
【技术保护点】
1.一种空气污染物个体暴露浓度评估方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的空气污染物个体暴露浓度评估方法,其特征在于,所述第一数据集合为训练集数据,第二数据集合为验证集数据。
3.根据权利要求2所述的空气污染物个体暴露浓度评估方法,其特征在于,所述大样本人群空气污染物个体暴露浓度初步模型与人群空气污染物个体暴露浓度预测模型均基于随机森林模型。
4.根据权利要求3所述的空气污染物个体暴露浓度评估方法,其特征在于,步骤1还包括:
5.根据权利要求3所述的空气污染物个体暴露浓度评估方法,其特征在于,步骤3还包括:
6.根据权利要求5所述的空气污染物个体暴露浓度评估方法,其特征在于,步骤3还包括:
7.根据权利要求6所述的空气污染物个体暴露浓度评估方法,其特征在于,步骤4还包括:
8.根据权利要求7所述的空气污染物个体暴露浓度评估方法,其特征在于,所述第一比较结果为空气污染物个体实际暴露浓度数值与空气污染物室外实际暴露浓度的第一比值;第二比较结果为所述人群空气污染物个体暴露浓度预测模型输
9.根据权利要求2所述的空气污染物个体暴露浓度评估方法,其特征在于,将未采样目标人群的数据信息,导入所述人群空气污染物个体暴露浓度预测模型,得到未采样目标人群的空气污染物个体暴露浓度评估结果。
10.一种空气污染物个体暴露浓度评估装置,其特征在于,包括:
...【技术特征摘要】
1.一种空气污染物个体暴露浓度评估方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的空气污染物个体暴露浓度评估方法,其特征在于,所述第一数据集合为训练集数据,第二数据集合为验证集数据。
3.根据权利要求2所述的空气污染物个体暴露浓度评估方法,其特征在于,所述大样本人群空气污染物个体暴露浓度初步模型与人群空气污染物个体暴露浓度预测模型均基于随机森林模型。
4.根据权利要求3所述的空气污染物个体暴露浓度评估方法,其特征在于,步骤1还包括:
5.根据权利要求3所述的空气污染物个体暴露浓度评估方法,其特征在于,步骤3还包括:
6.根据权利要求5所述的空气污染物个体暴露浓度评估方法,其特征在于,步骤3还包括:
...
【专利技术属性】
技术研发人员:李湉湉,王彦文,杜艳君,班婕,孙庆华,马润美,
申请(专利权)人:中国疾病预防控制中心环境与健康相关产品安全所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。