【技术实现步骤摘要】
consideration[J].Information Sciences,2017,396:144
‑
61.”考虑实例间距离远近的影响,定义了一种新的根据距离进行密度加权的算法。随着空间同位模式挖掘的流行,不少研究工作将该挖掘理论运用到实际应用中,如基于POI数据的空间同位模式挖掘获取了城市服务业之间的空间关联结构“胡添,刘涛,杜萍,et al.空间同位模式支持下城市服务业关联发现及特征分析[J].地球信息科学学报,2021,23(6):10.”。基于概率的同位模式挖掘方法探究儿童癌症与污染物之间的关系“LI J,ADILMAGAMBETOV A,JABBAR M S M,et al.On discovering co
‑
location patterns in datasets:a case study of pollutants and child cancers[J].Geoinformatica,2016,20(4):651
‑
92.”,该方法将污染源视为不确定性数据,并对其进行真实世界的建模,发现了一些化学污染物的组合与某些癌症存在显著的关联关系。由于挖掘过程对网格粒度的选取较为敏感,不同粒度得到的结果差异很大,“谢旺,王丽珍,陈红梅,et al.基于空间序偶模式挖掘污染源与癌症病例的关系[J].数据分析与知识发现,2021,5(02):14
‑
31.”首次提出空间序偶模式用于挖掘污染源对癌症的影响关系,但是该挖掘方法先基于参与度挖掘出频繁空间序偶模式,又对模式影响度进行了计 ...
【技术保护点】
【技术特征摘要】
1.一种基于改进的空间同位模式挖掘工业污染对癌症影响的方法,其特征在于,包括以下步骤:步骤S1、根据风向、风速计算污染源实例集的偏移坐标,根据偏移坐标计算癌症实例c
s
.t与污染源实例p
i
.j之间的欧式距离dist(c
s
.t,p
i
.j);步骤S2、对输入的污染源实例集的浓度进行计算处理,得到污染源局部平均浓度和全局平均浓度;步骤S3、根据污染源局部平均浓度和全局平均浓度的关系,判断污染源影响半径大小,进而判断癌症实例c
s
.t与污染源实例p
i
.j间是否存在空间邻近关系;步骤S4、生成癌症实例集的星型邻居集;步骤S5、基于星型邻居集生成候选模式的星型影响实例表;步骤S6、基于KDE核密度估计模型,计算候选模式改进后的影响率步骤S7、基于污染源所属致癌类别计算候选模式的加权影响率步骤S8、计算候选模式的影响度,并判断候选模式的影响度WEI(SOPP_c)与影响度阈值min_pii的关系,如果WEI(SOPP_c)≥min_pii,则输出频繁模式。2.根据权利要求1所述的一种基于改进的空间同位模式挖掘工业污染对癌症影响的方法,其特征在于,所述步骤S2具体为:步骤S21、污染源实例p
i
.j不同时段的浓度值集合局部平均浓度为的平均值,计算如下:其中,conc
t
表示t时段的浓度值,t∈[1,q],步骤S22、全局平均浓度为污染源特征p
i
的实例集的局部平均浓度和的平均值,计算如下:其中,表示实例集中的污染源特征p
i
的实例数量。3.根据权利要求1所述的一种基于改进的空间同位模式挖掘工业污染对癌症影响的方法,其特征在于,所述步骤S3具体为:步骤S31、根据污染源局部平均浓度和全局平均浓度的关系,将污染源影响半径划分为三个等级,分别表示为r
min
,r
mid
,r
max
,且r
min
<r
mid
<r
max
,且r
min
,r
mid
,r
max
分别对应污染源低、中、高等级的浓度;步骤S32、污染源实例p
i
.j的影响半径r
pi.j
判断如下:
步骤S33、判断实例间的空间邻近关系R
c_p
,如果则称癌症实例c
s
.t与污染源实例p
i
.j存在邻近关系R
c_p
,记做其中为癌症实例c
s
.t的活动半径。4.根据权利要求1所述的一种基于改进的空间同位模式挖掘工业污染对癌症影响的方法,其特征在于,所述步骤S4中的星型邻居集指与癌症实例c
s
.t满足空间邻近关系的污染源实例的集合...
【专利技术属性】
技术研发人员:王丽珍,张玲莉,王东升,杨培忠,周丽华,陈红梅,肖清,
申请(专利权)人:云南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。