基于大数据数据管理服务系统技术方案

技术编号：11027297 阅读：140 留言：0更新日期：2015-02-11 14:45

一种基于大数据数据管理服务系统，包括：异构数据的归一化描述模块，数据语义化模块，数据存储性能模块，数据逻辑管理模块，数据场景化及服务匹配模块和数据展示模块。基于场景的大数据管理服务系统解决的问题如下：第一，现在数据体量(volumes)大，其次数据类别(variety)大，数据来自多种数据源，数据种类和格式丰富综合形成了存储困难的问题。第二，数据异构的描述。大数据多源的数据形成了一个个数据孤岛。在每种数据源中不但有各不相同的数据结构，同时也有不同的命名体系。即使同构的数据也无法互通。第三，数据匹配难题，由于数据种类的结构不同形成的数据匹配问题，查准率和召回率低下，查询代价高昂。

全部详细技术资料下载

【技术实现步骤摘要】
基于大数据数据管理服务系统
本专利技术涉及大数据管理服务，属于计算机与网络技术应用领域。
技术介绍
根据IDC做出的估测，数据一直都在以每年50％的速度增长，也就是说每两年就增长一倍(大数据摩尔定律)，这意味着人类在最近两年产生的数据量相当于之前产生的全部数据量，预计到2020年，全球将总共拥有35亿GB的数据量，相较于2010年，数据量将增长近30倍。这不是简单的数据增多的问题，而是全新的问题。“大数据”是一个体量特别大，数据类别特别大的数据集，并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。它的特点首先是数据体量(volumes)大，指代大型数据集，一般在10TB规模左右，在实际应用中，很多企业用户把多个数据集放在一起，已经形成了PB级的数据量；其次是指数据类别(variety)大，数据来自多种数据源，数据种类和格式日渐丰富，已冲破了以前所限定的结构化数据范畴，囊括了半结构化和非结构化数据。整个网络系统会产生数量巨大的数据，如何存储产生的这些海量数据，已经是一个摆在面前亟待解决的问题。但是这只解决了大数据的一个问题，即数据存储。伴随着数据量的不断增长，还有一个问题日益凸显：数据查询。对海量数据来说驳杂的数据是没有价值的，并且精确的查找是难度很高且准确率不高的工作。
技术实现思路
本专利技术要解决的技术问题：海量数据的存储问题、异构数据的统一描述和数据服务匹配的查准率和召回率低的问题。提供可扩展、易用、高可靠性的大数据管理服务系统。本专利技术采用的技术方案：基于大数据数据管理服务系统，其特征在于：异构数据本体描述子系统、数据逻辑管理子系统和...

【技术保护点】
一种基于大数据数据管理服务系统，其特征在于：包括异构数据本体描述子系统、数据逻辑管理子系统和数据服务匹配子系统；数据描述子系统是数据逻辑管理和数据服务匹配的基础；通过异构数据本体描述将异构的不易理解的数据用相同方式表征出来，使得能够理解数据内容；在此基础上，根据异构数据本体描述的内容，抽取部分信息，在逻辑上建立关联关系实现数据逻辑管理子系统，数据服务匹配子系统根据数据的逻辑关系和描述信息进行查找和匹配。

【技术特征摘要】
1.一种基于大数据数据管理服务系统，其特征在于：包括异构数据本体描述子系统、数据逻辑管理子系统和数据服务匹配子系统；异构数据本体描述子系统是数据逻辑管理和数据服务匹配的基础；通过异构数据本体描述将异构的不易理解的数据用相同方式表征出来，使得能够理解数据内容；在此基础上，根据异构数据本体描述的内容，抽取部分信息，在逻辑上建立关联关系实现数据逻辑管理子系统，数据服务匹配子系统根据数据的逻辑关系和描述信息进行查找和匹配；数据逻辑管理子系统采用时间、空间和目录结构进行原始数据管理和采用场景化进行数据语义层次的数据分类管理；其中时间、空间和目录结构是单维度的数据关系，即从一个维度进行的数据关系的结构建立；场景化是多维度的数据关系管理，即在多个维度下共同符合同一场景的数据在一个数据场景中；场景定义是从属性、本体中抽取信息组成一个全方位立体的场景，包含不同种不同结构的相关数据；场景定义和场景匹配：1)场景定义：场景的定义由6个部分构成：场景名、本体集、属性集、语义集、属性权重和语义权重；场景的定义过程如下：A)定义本体集、定义属性集、定义语义集；B)确定属性集和语义集各元素权重；C)测试集测试；D)根据结果调节权值，返回C，至到权值稳定。2.根据权利要求1所述的一种基于大数据数据管理服务系统，其特征在于：异构数据本体描述子系统采用OWL(WebOntologyLanguage)进行异构数据的描述和采用WSDL(WebServicesDescriptionLanguage)进行数据服务本身接口、参数的描述；根据W3C标准，引用通用本体库并通过自建本体库的形式完善数据共享领域的本体库；WSDL对数据服务的接口、类型、参数信息进行描述并同时引用OWL对数据本体进行说明，通过WSDL和OWL共同描述数据和数据服务。3.根据权利要求1所述的一种基于大数据数据管理服务系统，其特征在于：数据服务匹配子系统能够通过本体、属性、和语义分别对数据服务进行匹配。4.根据权利要求2所述的一种基于大...

【专利技术属性】
技术研发人员：姜骁，熊桂喜，杜博文，詹俊峰，肖道锐，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人