一种构建行业风险暴露数据库的POI数据清洗与融合方法及装置制造方法及图纸

技术编号:28753645 阅读:19 留言:0更新日期:2021-06-09 10:19
本发明专利技术涉及一种构建行业风险暴露数据库的POI数据清洗及融合方法,包括数据采集步骤、数据处理步骤、数据输出步骤。所述数据采集步骤包括:获取每个POI数据的属性信息和空间位置信息;获取每个POI数据按照属性信息进行评定的分值;获取每个POI数据的关系类型。所述数据处理步骤包括:至少基于所述属性信息和/或分值和/或关系类型将POI数据进行清洗;基于位置信息和/或关系类型将清洗后的POI数据进行空间合并,并为合并后的POI数据赋分;汇总清洗后的POI数据和空间合并后的POI数据,作为POI最终空间分布的权重。所述数据输出步骤包括:将汇总的POI数据以汇总文件形式输出,并结合GIS技术进行图形显示。经过大量的商业、工业造价拆分空间分布合理性检验及商业、工业面积拆分定量实验表明,应用该POI数据清洗及融合方法能够较好地构建行业风险暴露数据库,并满足地震、台风等巨灾模型的需求。台风等巨灾模型的需求。台风等巨灾模型的需求。

【技术实现步骤摘要】
一种构建行业风险暴露数据库的POI数据清洗与融合方法及装置


[0001]本专利技术属于POI数据处理领域,特别涉及一种构建行业风险暴露数据库的POI数据清洗及融合方法及装置,可以运用在地震、台风、洪水等巨灾模型中。

技术介绍

[0002]行业风险暴露数据库AED(Aggregate Exposure Database)反映社会可保商业、工业、住宅建筑面积、造价及其空间分布。因此,行业风险暴露数据库可以为省级或地市级的累积总保额做空间拆分,最大可能的减少累积保额下地震保险损失结果的不确定性,提升其在保险定价及地震风险管理中的实用价值。同时,行业风险暴露数据库也可以用来评估地震造成的商业、工业、住宅社会整体经济损失,帮助政府部门及时有效应对灾害,抗震救灾。然而,以构建中国(含香港、澳门等)行业风险暴露数据库AED为例,由于数据的缺失,尚未有成功构建中国商业、工业风险暴露数据库的报道,也没有利用地市级统计年鉴建筑面积及单位造价数据并基于建筑轮廓和POI数据进行空间拆分的报道,更没有如何利用计算机技术完成基于建筑轮廓和POI数据进行空间拆分中POI数据清洗及融合方法的报道。

技术实现思路

[0003]为解决上述技术问题,本专利技术提供了一种构建行业风险暴露数据库的POI数据清洗及融合方法,其包括数据采集步骤、数据处理步骤、数据输出步骤:
[0004]所述数据采集步骤包括:
[0005]获取每个POI数据的属性信息和空间位置信息;
[0006]获取每个POI数据按照属性信息进行评定的分值
[0007]获取每个POI数据的关系类型;
[0008]所述数据处理步骤包括:
[0009]至少基于所述属性信息和/或分值和/或关系类型将POI数据进行清洗;
[0010]基于位置信息和/或关系类型将清洗后的POI数据进行空间合并,并为合并后的POI数据赋分;
[0011]汇总清洗后的POI数据和空间合并后的POI数据,作为最终价值分配权重和空间分布位置的POI;
[0012]所述数据输出步骤包括:
[0013]将汇总的POI数据以汇总文件形式输出,并结合GIS技术进行图形显示。
[0014]本专利技术还提供了一种构建行业风险暴露数据库的POI数据清洗及融合装置,包括数据采集装置、数据处理装置、数据输出装置:
[0015]所述数据采集装置被配置为:
[0016]获取每个POI数据的属性信息和空间位置信息;
[0017]获取每个POI数据按照属性信息进行评定的分值;
[0018]获取每个POI数据的关系类型;
[0019]所述数据处理装置包括:
[0020]清洗装置,所述清洗装置被配置为至少基于所述属性信息和/或分值和/或关系类型将POI数据进行清洗;
[0021]空间合并装置,所述空间合并装置被配置为基于位置信息和/或关系类型和/或属性信息将清洗后的POI数据进行空间合并,并为合并后的POI数据赋分;
[0022]汇总清洗后的POI数据和空间合并后的POI数据,作为POI最终空间分布的权重;
[0023]所述数据输出装置被配置为:
[0024]将汇总的POI数据以汇总文件形式输出,并结合GIS技术进行图形显示。
[0025]本专利技术的有益效果在于,提供了一种如何利用计算机技术完成基于建筑轮廓和POI数据进行空间拆分中POI数据清洗及融合方法,经过大量的商业、工业造价拆分空间分布合理性检验及商业、工业造价拆分定量实验表明,应用该POI数据清洗及融合方法能够较好地构建行业风险暴露数据库,并满足地震巨灾模型等需求。
附图说明
[0026]图1POI数据清洗及融合前后的对比;
[0027]图2北京市商业造价空间分布合理性检验;
[0028]图3北京市朝阳区商业造价空间分布;
[0029]图4北京市西城区商业造价空间分布;
[0030]图5北京市海淀区商业造价空间分布;
[0031]图6北京市工业造价空间分布合理性检验;
[0032]图7上海市商业建筑面积定量检验;
[0033]图8上海市工业建筑面积定量检验;
[0034]图9全国商业建筑面积空间分布图;
[0035]图10全国商业造价空间分布图;
[0036]图11全国工业面积空间分布图;
[0037]图12全国工业造价空间分布图。
具体实施方式
[0038]本专利技术关于一种构建行业风险暴露数据库的POI数据清洗及融合方法的一些实施例中,主要包括数据采集步骤、数据处理步骤、数据输出步骤:
[0039]所述数据采集步骤包括:
[0040]获取每个POI数据的属性信息和空间位置信息;
[0041]获取每个POI数据按照属性信息进行评定的分值;
[0042]获取每个POI数据的关系类型;
[0043]所述数据处理步骤包括:
[0044]至少基于所述属性信息和/或分值和/或关系类型将POI数据进行清洗;
[0045]基于位置信息和/或关系类型将清洗后的POI数据进行空间合并,并为合并后的POI数据赋分;
[0046]汇总清洗后的POI数据和空间合并后的POI数据,作为POI最终价值分配权重和空间分布位置的POI;
[0047]所述数据输出步骤包括:
[0048]将汇总的POI数据以汇总文件形式输出,并结合GIS技术进行图形显示。
[0049]其中,“POI(Point Of Interest)”又称“兴趣点”,一个POI可以是一个超市、一个大厦、一个公交站等。POI可用于描述“兴趣点”的经纬度、名称、地址、用途等,包括商业POI数据、工业POI数据,通常包括唯一识别编号(FID)、类型(KIND)、经度(LON)、纬度(LAT)、POI编号(POI_ID)关系类型(TYPE)等字段的属性信息;“分值”为所述POI数据的KIND字段,体现POI在最终空间分布的权重,任何已知的赋分方法都在本专利技术的选择范围之内;“关系类型”为所述POI数据的TYPE字段。
[0050]本专利技术关于清洗方法的一些实施例中包括:
[0051]判断关系类型为第一类标签还是第二类标签;
[0052]判断同一标的是否包括多个POI_ID;
[0053]当关系类型为第一类标签时,即识别到多个POI_ID中包括父类POI_ID和子类POI_ID时,将子类POI_ID进行删除;比如,POI Rel_Type关系如下:Rel_Type=1,表示POI_ID1为POI_ID2的父,关系类型为物理关系,即同一标的是由多个POI_ID组成的,如中再大厦有大厦建筑的POI_ID1和正门POI_ID2,此时需要对子类ID进行识别和删除。
[0054]当关系类型为第二类标签时,即识别到多个POI_ID为同一POI,按照不同类型的权重打分高低进行取舍,去掉得分较低的POI_I本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种构建行业风险暴露数据库的POI数据清洗及融合方法,其特征在于,包括数据采集步骤、数据处理步骤、数据输出步骤:所述数据采集步骤包括:获取每个POI数据的属性信息和空间位置信息;获取每个POI数据按照属性信息进行评定的分值;获取每个POI数据的关系类型;所述数据处理步骤包括:至少基于所述属性信息和/或分值和/或关系类型将POI数据进行清洗;基于位置信息和/或关系类型将清洗后的POI数据进行空间合并,并为合并后的POI数据赋分;汇总清洗后的POI数据和空间合并后的POI数据,作为POI最终价值分配权重和空间分布位置的POI;所述数据输出步骤包括:将汇总的POI数据以汇总文件形式输出,并结合GIS技术进行图形显示。2.如权利要求1所述的方法,其特征在于,所述清洗方法包括:判断关系类型为第一类标签还是第二类标签;判断同一标的是否包括多个POI_ID;当关系类型为第一类标签时,即识别到多个POI_ID中包括父类POI_ID和子类POI_ID时,将子类POI_ID进行删除;当关系类型为第二类标签时,即识别到多个POI_ID为同一POI,按照不同类型的权重打分高低进行取舍,去掉得分较低的POI_ID。3.如权利要求2所述的方法,其特征在于,所述空间合并方法包括:判断关系类型为第一类标签还是第二类标签;当关系类型为第二类标签时,且当识别到多个POI_ID为不同POI,但是基于所述位置信息判断多个POI_ID相距小于阈值n时(比如10米以内),将这些POI合并,合并后的POI数据的权重值取各POI权重打分的总和。4.如权利要求1所述的方法,其特征在于,所述数据采集步骤包括:采集预建立行业风险暴露数据库的地理范围内的二级地理范围的商业POI数据及工业POI数据、POI最终打分表、所述二级地理范围的POI关系表及其父子关系表、要删除的POI_ID表;所述数据处理步骤包括:读取采集到的POI数据的FID、KIND、LON、LAT、POI_ID字段;读取POI最终打分表并根据POI数据的KIND对应的打分值为POI赋分;读取父子关系表并删除子类POI数据;读取要删除的POI_ID表并删除重复的POI数据;选出父类POI数据以及非父类POI数据汇总;所述数据输出步骤包括:输出赋分完以后的POI;
父子关系表;要删除的POI_ID表汇总结果文件。5.如权利要求4所述的方法,其特征在于,所述选出父类POI数据以及非父类POI数据汇总步骤中,非父类POI数据进行近距离空间合并后再进行汇总。6.一种行业风险暴露数据库POI数据清洗及融合装置,...

【专利技术属性】
技术研发人员:熊政辉史萍岳溪柳周俊华
申请(专利权)人:中再巨灾风险管理股份有限公司中国财产再保险有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1