一种元数据的数据目录处理方法、装置以及处理设备制造方法及图纸

技术编号:39327047 阅读:12 留言:0更新日期:2023-11-12 16:04
本申请提供了一种元数据的数据目录处理方法、装置以及处理设备,用于针对无人机测绘场景所涉及的元数据的数据目录,提供一套更为适配、高精度且便于管理的构造方案,从而有助于为无人机测绘工作提供更佳的应用环境。本申请提供的元数据的数据目录处理方法,包括:获取无人机测绘场景所得到的元数据;计算元数据的指标和标签,形成指标、标签级别的数据目录;对指标、标签级别的数据目录进行语义分析,得到语义分析结果;对语义分析结果进行目录词汇的语义相似性判断,并将语义相似性高于阈值的部分进行目录聚类,形成聚类簇;通过聚类簇共同的语义特征建立目录主题,形成基于专题和子专题的目录分类体系,得到语义级别的数据目录。录。录。

【技术实现步骤摘要】
一种元数据的数据目录处理方法、装置以及处理设备


[0001]本申请涉及测绘领域,具体涉及一种元数据的数据目录处理方法、装置以及处理设备。

技术介绍

[0002]在无人机测绘场景下,容易理解,涉及到大规模的数据采集工作,例如无人机航拍数据、定位数据、雷达数据等,以便为后方的测绘工作提供详尽且精确的数据支持。
[0003]而在后方的数据中心或者工作站,则需要对测绘数据进行妥善的数据管理工作,以为后续的数据处理打下良好的基础。
[0004]而本申请专利技术人发现,在无人机测绘场景下对相关的元数据进行数据管理工作时,基于现有的目录构建方式则存在检索效率和检索精度有限的问题,而元数据的使用效果显然又会在应用环境上影响着无人机测绘处理的处理效果,显然需要对无人机测绘场景下元数据的目录构造方案进行适应性优化。

技术实现思路

[0005]本申请提供了一种元数据的数据目录处理方法、装置以及处理设备,用于针对无人机测绘场景所涉及的元数据的数据目录,提供一套更为适配、高精度且便于管理的构造方案,从而有助于为无人机测绘工作提供更佳的应用环境。
[0006]第一方面,本申请提供了一种元数据的数据目录处理方法,方法包括:
[0007]获取无人机测绘场景所得到的元数据;
[0008]计算元数据的指标和标签,形成指标、标签级别的数据目录;
[0009]对指标、标签级别的数据目录进行语义分析,得到语义分析结果;
[0010]对语义分析结果进行目录词汇的语义相似性判断,并将语义相似性高于阈值的部分进行目录聚类,形成聚类簇;
[0011]通过聚类簇共同的语义特征建立目录主题,形成基于专题和子专题的目录分类体系,得到语义级别的数据目录。
[0012]结合本申请第一方面,在本申请第一方面第一种可能的实现方式中,语义级别的数据目录还按照数据分层架构进行划分,其中,数据分层架构具体包括数据表类型、指标类型、标签类型和可视化报表类型的架构。
[0013]结合本申请第一方面第一种可能的实现方式,在本申请第一方面第二种可能的实现方式中,数据表类型的架构具体包括贴源层、公共层和应用层的架构。
[0014]结合本申请第一方面第二种可能的实现方式,在本申请第一方面第三种可能的实现方式中,贴源层的架构具体包括L0层的贴源层、L1层的业务系统和L2层的物理表;
[0015]公共层的架构具体包括L0层的公共层、L1层的数据集、L2层的数据子域和L3层的事实表。
[0016]结合本申请第一方面第一种可能的实现方式,在本申请第一方面第四种可能的实
现方式中,指标类型的架构具体包括L0层的业务域、L1层的数据集、L2层的业务限定和L3层的派生指标。
[0017]结合本申请第一方面第一种可能的实现方式,在本申请第一方面第五种可能的实现方式中,标签类型的架构具体包括L0层的领域分类、L1层的行为板块、L2层的行为分类、L3层的行为分析和L4层的标签。
[0018]结合本申请第一方面,在本申请第一方面第六种可能的实现方式中,获取无人机测绘场景所得到的元数据,包括:
[0019]从测绘信息元数据库中,获取无人机测绘场景所得到的元数据,其,测绘信息元数据库所存储的元数据是从无人机测绘场景所得到的多个数据集并配置每个数据集的自描述文件得到的,测绘信息元数据库采用多级主从式数据库结构,并在本级结构内采用备份策略实现存储以及更新。
[0020]第二方面,本申请提供了一种元数据的数据目录处理装置,装置包括:
[0021]获取单元,用于获取无人机测绘场景所得到的元数据;
[0022]计算单元,用于计算元数据的指标和标签,形成指标、标签级别的数据目录;
[0023]分析单元,用于对指标、标签级别的数据目录进行语义分析,得到语义分析结果;
[0024]聚类单元,用于对语义分析结果进行目录词汇的语义相似性判断,并将语义相似性高于阈值的部分进行目录聚类,形成聚类簇;
[0025]建立单元,用于通过聚类簇共同的语义特征建立目录主题,形成基于专题和子专题的目录分类体系,得到语义级别的数据目录。
[0026]结合本申请第二方面,在本申请第二方面第一种可能的实现方式中,语义级别的数据目录还按照数据分层架构进行划分,其中,数据分层架构具体包括数据表类型、指标类型、标签类型和可视化报表类型的架构。
[0027]结合本申请第二方面第一种可能的实现方式,在本申请第二方面第二种可能的实现方式中,数据表类型的架构具体包括贴源层、公共层和应用层的架构。
[0028]结合本申请第二方面第二种可能的实现方式,在本申请第二方面第三种可能的实现方式中,贴源层的架构具体包括L0层的贴源层、L1层的业务系统和L2层的物理表;
[0029]公共层的架构具体包括L0层的公共层、L1层的数据集、L2层的数据子域和L3层的事实表。
[0030]结合本申请第二方面第一种可能的实现方式,在本申请第二方面第四种可能的实现方式中,指标类型的架构具体包括L0层的业务域、L1层的数据集、L2层的业务限定和L3层的派生指标。
[0031]结合本申请第二方面第一种可能的实现方式,在本申请第二方面第五种可能的实现方式中,标签类型的架构具体包括L0层的领域分类、L1层的行为板块、L2层的行为分类、L3层的行为分析和L4层的标签。
[0032]结合本申请第二方面,在本申请第二方面第六种可能的实现方式中,获取单元,具体用于:
[0033]从测绘信息元数据库中,获取无人机测绘场景所得到的元数据,其,测绘信息元数据库所存储的元数据是从无人机测绘场景所得到的多个数据集并配置每个数据集的自描述文件得到的,测绘信息元数据库采用多级主从式数据库结构,并在本级结构内采用备份
策略实现存储以及更新。
[0034]第三方面,本申请提供了一种处理设备,包括处理器和存储器,存储器中存储有计算机程序,处理器调用存储器中的计算机程序时执行本申请第一方面或者本申请第一方面任一种可能的实现方式提供的方法。
[0035]第四方面,本申请提供了一种计算机可读存储介质,计算机可读存储介质存储有多条指令,指令适于处理器进行加载,以执行本申请第一方面或者本申请第一方面任一种可能的实现方式提供的方法。
[0036]从以上内容可得出,本申请具有以下的有益效果:
[0037]针对无人机测绘场景所涉及的元数据的数据目录,本申请获取无人机测绘场景所得到的元数据到,计算该元数据的指标和标签,形成指标、标签级别的数据目录,接着继续对指标、标签级别的数据目录进行语义分析,得到语义分析结果,再对语义分析结果进行目录词汇的语义相似性判断,并将语义相似性高于阈值的部分进行目录聚类,形成聚类簇,此时通过聚类簇共同的语义特征建立目录主题,形成基于专题和子专题的目录分类体系,得到语义级别的数据目录,由此结合语义信息来提高服务描述,还有检索方面的精度和效率,由此提供了一套更为适配、高本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种元数据的数据目录处理方法,其特征在于,所述方法包括:获取无人机测绘场景所得到的元数据;计算所述元数据的指标和标签,形成指标、标签级别的数据目录;对所述指标、标签级别的数据目录进行语义分析,得到语义分析结果;对所述语义分析结果进行目录词汇的语义相似性判断,并将语义相似性高于阈值的部分进行目录聚类,形成聚类簇;通过所述聚类簇共同的语义特征建立目录主题,形成基于专题和子专题的目录分类体系,得到语义级别的数据目录。2.根据权利要求1所述的方法,其特征在于,所述语义级别的数据目录还按照数据分层架构进行划分,其中,所述数据分层架构具体包括数据表类型、所述指标类型、所述标签类型和可视化报表类型的架构。3.根据权利要求2所述的方法,其特征在于,所述数据表类型的架构具体包括贴源层、公共层和应用层的架构。4.根据权利要求3所述的方法,其特征在于,所述贴源层的架构具体包括L0层的贴源层、L1层的业务系统和L2层的物理表;所述公共层的架构具体包括L0层的公共层、L1层的数据集、L2层的数据子域和L3层的事实表。5.根据权利要求2所述的方法,其特征在于,所述指标类型的架构具体包括L0层的业务域、L1层的数据集、L2层的业务限定和L3层的派生指标。6.根据权利要求2所述的方法,其特征在于,所述标签类型的架构具体包括L0层的领域分类、L1层的行为板块、L2层的行为分类、L3层的行为分析和L...

【专利技术属性】
技术研发人员:邵广哲李广勤刘玉生
申请(专利权)人:广东粤电南水发电有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1