一种基于粒数据的信息资源管理与分析方法技术

技术编号：29673230 阅读：14 留言：0更新日期：2021-08-13 21:54

本发明专利技术公开了一种基于粒数据的信息资源管理与分析方法，分析方法步骤如下：1、构建粒数据的标签知识本体；2、对输入的多源数据集进行预处理，并对每个单元赋予多维标签，生成粒数据集；3、构建粒数据逻辑存储适配器，将粒数据集映射到物理存储；4、构建粒数据装载组件；5、定义粒数据分析描述语言，构建粒数据分析组件；6、实现统一的系统内和系统间粒数据共享访问控制决策器，根据访问控制决策器的判别结果确定每一颗粒数据的访问权限；7、提供结果粒数据集的格式化和可视化输出。本发明专利技术在灵活而高效的管理和分析信息资源的同时亦不失通用性，解决了现有信息资源管理和分析技术通用性查、灵活性弱的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于粒数据的信息资源管理与分析方法
本专利技术属于信息资源管理与分析领域，具体涉及一种基于粒数据的信息资源分析方法。
技术介绍
随着人类活动的信息化和网络化，当前网络空间中分布着海量数据及其所承载的信息资源，因此有效的管理和分析多元异构信息资源十分必要。随着算力的不断提升和人工智能新技术的应用，信息资源的管理和分析技术面临着新的机遇和挑战。当前的信息资源管理与分析技术，通常有如下三种方法：1.基于数据仓库的数据挖掘技术数据仓库是面向主题的数据集合，信息资源经过数据抽取、转换、装载三个过程即ETL过程构建多维数据模型，再通过联机分析处理(OnlineAnalyticalProcessing,OLAP)实现数据分析和辅助决策。代表性系统有OracleWarehouse，支持面向主题的复杂查询、数据快照等特性。虽然此方法具有较高的查询和分析效率，但是数据抽取和转换过程需要大量的数据清洗如标准化、归一化等过程，否则难以保证数据质量。此外，数据仓库仅依赖数据的主题属性进行管理和分析，维度单一且无法动态调整，极大的影响数据挖掘和分析能力。2.基于知识图谱的数据分析技术知识图谱本质上是一种描述实体之间关系的语义网络，通过对信息中知识的抽取、表示和融合，挖掘和预测数据内在的关联关系，进而实现数据深度分析和应用。代表性系统有Neo4j图数据库，支持知识图谱的构建和强大的查询能力。此方法具有较强的数据挖掘和知识推理能力，并可在图层面上借助链接预测算法实现一定程度的自学习能力。然...

【技术保护点】
1.一种基于粒数据的信息资源管理与分析方法，其特征在于，包括以下步骤：/n步骤S01：根据国家标准和行业最佳实践构建粒数据的标签知识本体；/n步骤S02：基于步骤S01构建的标签知识本体，对输入的多源数据集进行预处理，提取具有完整逻辑含义的最小处理单位，并对每个单元赋予多维标签，生成粒数据集；/n步骤S03：按照不同的物理存储架构，构建灵活的粒数据逻辑存储适配器，将步骤S02生成的粒数据集映射到物理存储；/n步骤S04：构建粒数据装载组件，支持基于粒数据标签的常规检索和语义计算，根据应用需求提取S03中存储的粒数据集进一步分析处理；/n步骤S05：定义粒数据分析描述语言，构建粒数据分析组件，对S04输出的数据集进行分析，并生成分析结果粒数据集；/n步骤S06：实现统一的系统内和系统间粒数据共享访问控制决策器，对步骤S04和步骤S05中生成的粒数据集根据访问控制决策器的判别结果确定每一颗粒数据的权限；/n步骤S07：对步骤S06的结果粒数据集提供报表数据和可视化输出。/n

【技术特征摘要】
1.一种基于粒数据的信息资源管理与分析方法，其特征在于，包括以下步骤：
步骤S01：根据国家标准和行业最佳实践构建粒数据的标签知识本体；
步骤S02：基于步骤S01构建的标签知识本体，对输入的多源数据集进行预处理，提取具有完整逻辑含义的最小处理单位，并对每个单元赋予多维标签，生成粒数据集；
步骤S03：按照不同的物理存储架构，构建灵活的粒数据逻辑存储适配器，将步骤S02生成的粒数据集映射到物理存储；
步骤S04：构建粒数据装载组件，支持基于粒数据标签的常规检索和语义计算，根据应用需求提取S03中存储的粒数据集进一步分析处理；
步骤S05：定义粒数据分析描述语言，构建粒数据分析组件，对S04输出的数据集进行分析，并生成分析结果粒数据集；
步骤S06：实现统一的系统内和系统间粒数据共享访问控制决策器，对步骤S04和步骤S05中生成的粒数据集根据访问控制决策器的判别结果确定每一颗粒数据的权限；
步骤S07：对步骤S06的结果粒数据集提供报表数据和可视化输出。

2.根据权利要求1所述的基于粒数据的信息资源管理与分析方法，其特征在于：在步骤S01中所述的“粒数据标签知识本体”，指的是粒数据的属性集合，包括指标、分组、时间、空间、计量单位和主题。

3.根据权利要求1所述的基于粒数据的信息资源管理与分析方法，其特征在于：在步骤S02中所述的“对输入的多源数据集进行预处理”，做法如下：(1)对于半结构化数据，通过将模式中的多层嵌...

【专利技术属性】
技术研发人员：黄德会，
申请(专利权)人：京软伟业信息技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人