【技术实现步骤摘要】
智能数据标准目录生成方法和装置
本专利技术属于计算机
,尤其涉及一种智能数据标准目录生成方法、装置、电子设备及可存储介质。
技术介绍
大多数组织、企业普遍存在数据分散、数据来源多,整合后数据不一致,不同数据源的接口众多,同一类数据采用的标准、规则都不一致,无法确认数据的可信度、时效性、重要性等问题。人们花费了太多的时间去寻找有意义的、可信赖的数据,尽管数据专业人员花费大部分时间来获得洞察力,花在执行分析上的时间是搜索和准备数据所花费时间的一小部分。因此,需要将数据进行分类,形成便于使用和查找的数据目录。
技术实现思路
本专利技术实施例的第一目的在于提供一种智能数据标准目录生成方法,可实现将海量数据集进行智能自动分类,形成便于使用和查找的数据目录。本专利技术实施例是这样实现的,一种智能数据标准目录生成方法,包括:扫描待分类数据集获取元数据,智能感知所述元数据,将所述元数据中的相似数据进行聚类得到多个目标数据,生成每个目标数据的表名,且将所述表名以SQL形式存储于数据库中;根据每个所述目标数据的数据特征生成每个所述目标数据对应的表名注释;统计每个所述目标数据的调用热度,检测每个所述目标数据的重要程度、数据时效性、数据波动性和信息完整度,根据所述调用热度、重要程度、数据时效性、数据波动性和信息完整度对每个所述目标数据进行综合评估,计算出每个所述目标数据的综合评分等级;以所述表名、表名注释、调用热度、重要程度、数据时效性、数据波动性、信息完整度和综合评
【技术保护点】
1.一种智能数据标准目录的生成方法,其特征在于,包括:/n扫描待分类数据集获取元数据,智能感知所述元数据,将所述元数据中的相似数据进行聚类得到多个目标数据,生成每个目标数据的表名,且将所述表名以SQL形式存储于数据库中;/n根据每个所述目标数据的数据特征生成每个所述目标数据对应的表名注释;/n统计每个所述目标数据的调用热度,检测每个所述目标数据的重要程度、数据时效性、数据波动性和信息完整度,根据所述调用热度、重要程度、数据时效性、数据波动性和信息完整度对每个所述目标数据进行综合评估,计算出每个所述目标数据的综合评分等级;/n以所述表名、表名注释、调用热度、重要程度、数据时效性、数据波动性、信息完整度和综合评分等级依次为列生成所述多个目标数据的数据目录。/n
【技术特征摘要】
1.一种智能数据标准目录的生成方法,其特征在于,包括:
扫描待分类数据集获取元数据,智能感知所述元数据,将所述元数据中的相似数据进行聚类得到多个目标数据,生成每个目标数据的表名,且将所述表名以SQL形式存储于数据库中;
根据每个所述目标数据的数据特征生成每个所述目标数据对应的表名注释;
统计每个所述目标数据的调用热度,检测每个所述目标数据的重要程度、数据时效性、数据波动性和信息完整度,根据所述调用热度、重要程度、数据时效性、数据波动性和信息完整度对每个所述目标数据进行综合评估,计算出每个所述目标数据的综合评分等级;
以所述表名、表名注释、调用热度、重要程度、数据时效性、数据波动性、信息完整度和综合评分等级依次为列生成所述多个目标数据的数据目录。
2.根据权利要求1所述的智能数据标准目录生成方法,其特征在于,在所述扫描待分类数据集获取元数据,智能感知所述元数据,将所述元数据中的相似数据进行聚类得到多个目标数据,生成每个目标数据的表名之后,还包括:获取每个所述表名所对应的目标数据的表的行数、表的创建时间,表的更新时间,以序号为表头,所述表名、表的行数、表的创建时间,表的更新时间、表名注释、调用热度、重要程度、数据时效性、数据波动性、信息完整度和综合评分等级依次为列生成所述多个目标数据的数据目录。
3.根据权利要求1所述的智能数据标准目录生成方法,其特征在于,所述根据每个所述目标数据的数据特征生成每个所述目标数据对应的表名注释包括:通过语义分析和通用术语识别,推荐字段名称、字段长度和字段注释,根据选定的所述字段名称、字段长度和字段注释生成每个所述目标数据对应的表名注释。
4.根据权利要求1所述的智能数据标准目录生成方法,其特征在于,所述扫描待分类数据集获取元数据,智能感知所述元数据,将所述元数据中的相似数据进行聚类得到多个目标数据,生成每个目标数据的表名包括:基于AI人工智能技术,扫描全域数据集获取元数据,通过机器学习智能感知所述元数据,聚类分析所述元数据,将所述元数据中的相似数据进行聚类得到多个目标数据,生成每个目标数据的表名。
5.根据权利要求1所述的智能数据标准目录生成方法,其特征在于,所述统计每个所述目标数据的调用热度,检测每个所述目标数据的重要程度、数据时效性、数据波动性和信息完整度,根据所述调用热度、重要程度、数据时效性、数据波动性和信息完整度对每个所述目标数据进行综合评估,计算出每个所述目标数据的综合评分等级包括:基于所述调用热度、...
【专利技术属性】
技术研发人员:乔吴岭,吴林强,林健,刘飞燕,孟庆丰,黄亮,
申请(专利权)人:杭州城市大数据运营有限公司,湖州市大数据运营有限公司,杭州中云数据科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。