应用于数字孪生城市的空间数据集成方法及系统技术方案

技术编号:35552469 阅读:18 留言:0更新日期:2022-11-12 15:32
本发明专利技术公开了应用于数字孪生城市的空间数据集成方法及系统,涉及数字孪生城市技术领域,包括:接收所有数据源的数据,将数据源上传至服务器中,对多源数据进行检索和分析确定库中的数据的量及格式;识别库中的数据的主题,将主题作为标签对分类后的数据进行标记;对若干个库的数值进行量化,获取各个库的标准值,以标准值对库进行量化评估;依据数据格式之间转换难度,获取库的评估值;获取库评估值PG,依据库评估值PG对所有的库进行排序;依据库的排序从库中依次获取数据;通过获取格式难度值GsN以及库的标准值BZ,并获取到库评估值PG,依据库评估值PG为若干个库进行排序,确定数据采集策略,在进行空间数据采集,综合程度高。综合程度高。综合程度高。

【技术实现步骤摘要】
应用于数字孪生城市的空间数据集成方法及系统


[0001]本专利技术涉及数字孪生城市
,具体为应用于数字孪生城市的空间数据集成方法及系统。

技术介绍

[0002]数字孪生是指充分运用物理模型、传感器、运作历史等数据,集成多学科、多物理量、多尺度、多概率的模拟仿真全过程,在虚拟空间中完成映射,进而反映相对应实体设备的生命周期全过程。
[0003]数字孪生城市是在建筑信息模型和城市三维地理信息系统的基础上,利用物联网技术把物理城市的人、物、事件和水、电、气等所有要素进行数字化,然后在网络空间上构造一个与之完全对应的“虚拟城市”,形成物理维度上的实体城市和信息维度上的数字城市同生共存、虚实交融的局面。
[0004]在建立数字孪生城市时,需要获取大量的空间数据,但是空间数据的数据量大,呈现为多源多格式的状态,提高数据来源的库的数量众多,这就导致在对空间进行集成时,数据采集量大,采集难度大,难以获取到有效数据,降低空间数据集成的效率。

技术实现思路

[0005](一)解决的技术问题针对现有技术的不足,本专利技术提供了应用于数字孪生城市的空间数据集成方法及系统,通过接收所有数据源的数据,对多源数据进行检索和分析确定库中的数据的量及格式;将主题作为标签对分类后的数据进行标记;获取各个库的标准值,依据数据格式之间转换难度,获取库的评估值;依据库评估值对所有的库进行排序;依次获取数据;通过依据库评估值PG为若干个库进行排序,确定数据采集策略,在进行空间数据采集时,综合程度高,解决
技术介绍
中的问题。<br/>[0006](二)技术方案为实现以上目的,本专利技术通过以下技术方案予以实现:应用于数字孪生城市的空间数据集成方法,包括:接收所有数据源的数据,将数据源上传至服务器中,对多源数据进行检索和分析,确定库中的数据的量及格式;识别库中的数据的主题,将主题作为标签对分类后的数据进行标记;对若干个库的数值进行量化,获取各个库的标准值,以标准值对库进行量化评估;依据数据格式之间转换难度,与库的标准值相关联,获取库的评估值;获取库评估值PG,依据库评估值PG对所有的库进行排序;在进行数据采集时,依据库的排序,从库中依次获取数据。
[0007]进一步的,对多源数据中的格式进行识别,确定各个库内的数据总量,及库中数据的格式信息;依据数据的格式信息,对库中的数据进行分类,形成不同的数据类别;
依据各个格式下的数据量的大小,对各个数据类别次进行排序;在获取到库中各个格式的数据的总量后,确定各个类别中的出现次数最多格式,将其余若干格式向其中出现最多的格式进行转换,从而将本库中的格式统一化;通过训练过滤器,利用训练后的数据过滤器,过滤库中的无效数据,进而降低无效数据或者空白数据在库中产生的噪声,减少对正常数据的干扰。
[0008]进一步的,从若干个库中的一个中,选择出若干个数据,分别作为主题提取训练集及主题模型测试集;以训练集对LDA主题模型进行训练,生成训练后LDA主题模型,并利用主题测试集进行测试,确定训练出的LDA主题模型无误;利用训练得到的LDA模型对库中的若干个数据进行主题提取,获取若干个数据主题;利用相似度模型,判断不同主题间的相似度,依据相似度对获取若干个主题进行分类;依据主题名称生成主题标签,将该主题标签添加在相应数据分类类别中,以主题标签对该类别进行表征。
[0009]进一步的,获取所有库中的主题标签数量,计算主题标签的活跃度;获取所有库中的主题标签数量,计算主题标签的贡献度;计算库中主题标签与数据采集分析策略的主题的相似度,获取相似度数据;获取贡献度GxL、相似度Xs及总活跃度ZhY,进行归一化处理后,关联汇总形成库标准值,记为库标准值BZ;其计算方式符合如下公式:其中,,,且,为权重,其具体值可由用户依据实际经验进行调整及修正,通过改变的的数值,来对库的标准值BZ进行修正。
[0010]进一步的,以表示库中主题标签的最近的活跃度;以表示主题标签代表的数据分类中的数据主题在库中出现的总次数;以为库中的总数据量;其表达式为,为库中的总数据量;其表达式为,为活跃度的修正系数,其值大小由用户按照需求进行设置,方便对库的主题标签的活跃度进行修正;确定每个数据分类中的主题标签的数量及相应的活跃度,汇总形成总活跃度,记为总活跃度ZhY。
[0011]进一步的,在数据类别的主题标签下,所有的主题数量记为LtS,该主题标签下的数据占库中数据总量的百分比记为Zb;主题标签贡献度为GxL;贡献度GxL的计算方法符合以下表达式:
其中,为贡献度的修正系数,其值大小由用户按照需求进行设置,对库的主题标签的贡献度进行修正。
[0012]进一步的,获取数据采集及分析的策略,通过训练的LDA主题模型,对策略进行主题提取,获取到策略主题;从库中获取主题标签,利用相似度模型,判断库中的主题标签与策略主题的相似度,并对相似度的值进行量化;获取所有主题标签的量化后的相似度的值,进行排序,形成排序信息;获取库中所有的主题标签的相似度,并进行汇总,获取该库主题标签相似度的最大值,确定为相似度Xs。
[0013]进一步的,获取的各个库中内的数据格式,及相应的数据量,确定格式量数据;依据格式间的转换难度,对转换难度进行评分,获取不同格式之间转换时评分的均值,以评分均值对格式进行标记;以评分均值与库中数据量的积作为库的格式难度值GsN,并依据格式难度值GsN对若干个库进行排序;将其他的若干个库的数据格式向格式难度值GsN最低库的格式转换,将若干个库格式形成统一。
[0014]进一步的,获取格式难度值GsN以及库的标准值BZ,将两者进行关联,确定库评估值PG:其中,库的标准值的计算方法如下:其中,为修正系数,对库评估值PG进行修正,及在为权重系数,,,且,及的值由用户进行设置。
[0015]应用于数字孪生城市的空间数据集成系统,包括:数据分析模块,接收所有数据源的数据,对多源数据进行检索和分析确定库中的数据的量及格式;主题标记模块,识别库中的数据的主题,将主题作为标签对分类后的数据进行标记;数据量化模块,对若干个库的数值进行量化,获取各个库的标准值,以标准值对库进行量化评估;数据关联模块,依据数据格式之间转换难度,与库的标准值相关联,获取库的评估值;排序模块,获取库评估值PG,依据库评估值PG对所有的库进行排序;在进行数据采集时,依据库的排序,从库中依次获取数据。
[0016](三)有益效果本专利技术提供了应用于数字孪生城市的空间数据集成方法及系统。具备以下有益效果:
通过对单一库的数据格式的分布情况,对数据格式进行转换,能够降低格式转换的工作量,通过判断格式转换的难度,制定格式转换的策略,能够降低对各个库的数据转换时,提高格式转换的效率和速度,从而在数据的采集和识别时,降低多格式多源数据识别的难度。
[0017]通过对库的主题进行识别,并进行排序,从而对多源数据进行采集时,能够基于相似度,优先获取到相似度高的数据,因此,在采集多源数据时,能够快速地数据采集的需要,提高数据采集的效率。...

【技术保护点】

【技术特征摘要】
1.应用于数字孪生城市的空间数据集成方法,其特征在于:包括:接收所有数据源的数据,将数据源上传至服务器中,对多源数据进行检索和分析,确定库中的数据的量及格式;识别库中的数据的主题,将主题作为标签对分类后的数据进行标记;其中,获取所有库中的主题标签数量,计算主题标签的活跃度;获取所有库中的主题标签数量,计算主题标签的贡献度;计算库中主题标签与数据采集分析策略的主题的相似度,获取相似度数据;获取贡献度GxL、相似度Xs及总活跃度ZhY,进行归一化处理后,关联汇总形成库标准值,记为库标准值BZ;其计算方式符合如下公式:其中,,,且,为权重,其具体值可由用户依据实际经验进行调整及修正,通过改变的的数值,来对库的标准值BZ进行修正;对若干个库的数值进行量化,获取各个库的标准值,以标准值对库进行量化评估;依据数据格式之间转换难度,与库的标准值相关联,获取库的评估值;获取库评估值PG,依据库评估值PG对所有的库进行排序;在进行数据采集时,依据库的排序,从库中依次获取数据。2.根据权利要求1所述的应用于数字孪生城市的空间数据集成方法,其特征在于:对多源数据中的格式进行识别,确定各个库内的数据总量,及库中数据的格式信息;依据数据的格式信息,对库中的数据进行分类,形成不同的数据类别;依据各个格式下的数据量的大小,对各个数据类别次进行排序;在获取到库中各个格式的数据的总量后,确定各个类别中的出现次数最多格式,将其余若干格式向其中出现最多的格式进行转换,从而将本库中的格式统一化;通过训练过滤器,利用训练后的数据过滤器,过滤库中的无效数据,进而降低无效数据或者空白数据在库中产生的噪声,减少对正常数据的干扰。3.根据权利要求1所述的应用于数字孪生城市的空间数据集成方法,其特征在于:从若干个库中的一个中,选择出若干个数据,分别作为主题提取训练集及主题模型测试集;以训练集对LDA主题模型进行训练,生成训练后LDA主题模型,并利用主题测试集进行测试,确定训练出的LDA主题模型无误;利用训练得到的LDA模型对库中的若干个数据进行主题提取,获取若干个数据主题;利用相似度模型,判断不同主题间的相似度,依据相似度对获取若干个主题进行分类;依据主题名称生成主题标签,将该主题标签添加在相应数据分类类别中,以主题标签对该类别进行表征。4.根据权利要求1所述的应用于数字孪生城市的空间数据集成方法,其特征在于:
以表示库中主题标签的最近的活跃度;以表示主题标签代表的数据分类中的数据主题在库中出现的总次数;以为库中的总数据量;其表达式为,为库中的总数...

【专利技术属性】
技术研发人员:周春煦张建平陈梨春姜显贵李丹谢云飞施峰吉顺莉赵苏政倪飞施小飞戴雨王兆能曹野郑玉能仲文正陆丁炜鲍志鹏成海峰闵钰强丁杨曹毅沈媛
申请(专利权)人:江苏航运职业技术学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1