当前位置: 首页 > 专利查询>同济大学专利>正文

一种不确定数据上的多准则信息处理方法技术

技术编号:7105257 阅读:381 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种不确定数据上的多准则信息处理方法,包括以下步骤:(1)对面向不确定数据的多准则信息查询进行等价重写;(2)对概率关系部件上的多准则信息查询进行优化;(3)查询优化器生成概率关系部件上多准则信息查询执行计划;(4)查询处理器根据步骤(3)生成的计划对面向不确定数据的多准则信息进行查询,并将结果通过显示器显示。与现有技术相比,本发明专利技术具有提高企业的经济效益和市场竞争力等优点。

【技术实现步骤摘要】

本专利技术涉及一种多准则信息处理方法,尤其是涉及一种不确定数据上的多准则信息处理方法
技术介绍
如何从海量数据中快速分析出有用的信息,并为企业各管理层提供有效的决策支持是提高企业经济效益和市场竞争力的一个重要手段。近年来,研究人员主要从联机分析处理(Online Analytical Processing)和数据挖掘(Data Mining)这两个方面来为企业提供高质量的决策支持。联机分析处理旨在通过一系列复杂的多维联机查询(如Top-n查询、KNN查询、Rank查询、Range查询以及冰山查询等)来探索和透视整个企业数据,并返回海量数据的概括性信息。这样,用户就可以根据小数据量的概括性信息来完成相关的信息分析。然而,IBM公司Almaden研究院的R.Agrawal教授在2000年的SIGMOD国际会议上指出,传统的多维联机查询需要用户预先提供分析空间上的偏好权重向量(Preference Weight-Vector),而这在实际应用中是不可能的。因此,传统多维联机查询技术无法应用于与无权重分析处理相关的领域。为了有效支持企业用户进行无权重分析处理,在2001年的ICDE国际会议上,德国帕绍大学的S.Borzsonyi教授首次提出多准则信息查询的概念和技术。通过定义分析空间上的支配操作符,多准则信息查询返回企业数据中位于各支配序链最顶端的对象元组。目前,多准则信息查询技术广泛应用于商业智能分析、城市导航系统、数据挖掘和可视化、智能防御系统、以及地理信息系统等领域。随着企业对数据采集需求的不断深化和提高,不确定性数据(Uncertain Data)得到广泛的重视。在多数实际行业中(例如先进制造、物流、金融、电信、航空航天等行业),企业由于受数据采集设备的精度、数据自身的模糊和不完整性等因素的制约,使得数据的不确定性在企业内部数据源中普遍存在,不确定性数据正扮演着关键的角色。由于不确定数据需要引入关系表/属性字段的概率分布信息以及可能世界实例(Possible Worlds)语义,因此相对于传统关系数据库,不确定数据库在数据模型、代数操作规则、函数依赖、数据存储以及查询语义等要素上比传统关系数据库更为复杂。从而,传统关系数据库上的多准则信息查询技术无法直接运用于不确定数据库上。例如L.Antova教授在2008年的ICDE国际会议上指出:对于BNL算法,在传统关系数据库上的分析代价为PTIME时间复杂度,而在康奈尔大学开发的MayBMS不确定数据库系统上的析代价为coNP-Complete时间复杂度。目前不确定数据上的多准则信息查询技术主要存在如下四个重要不足:(1)现有技术没有考虑不确定数据底层的数据表示体系,只是简单地将不确定数据存储于同一张带概率分布信息的关系数据表中,而这在实际应用中是不现实的。(2)现有技术只针对固定分析空间来设计不确定数据上的多准则信息查询算法,而且它们所使用的R-树、kd-树以及AR-树索引均是标量型的,无法扩展到任意分析空间的应用场景中。然而在实际应用中,无权重的多准则信息查询是面向任意用户分析空间的。(3)现有技术没有将多准则信息查询集成进目前主流不确定数据库(U-Relational数据库、ULDB数据库和UDBMS数据库等)的查询优化器中,因此,当不确定数据库上的多准则信息查询涉及Conf、Merge、Ujoin等代数操作时,主流不确定数据库的查询优化器不能够提供有效的查询执行计划,从而严重影响用户的等待时间。(4)现有技术没有充分考虑多准则信息对象集的概率信息计算效率,相关技术给出的概率信息计算方法的时间复杂度均为#P-Hard,因此在现实应用中,仅多准则信息对象的概率信息计算时间用户就无法容忍。
技术实现思路
本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种提高企业的经济效益和市场竞争力的不确定数据上的多准则信息处理方法。本专利技术的目的可以通过以下技术方案来实现:一种不确定数据上的多准则信息处理方法,其特征在于,包括以下步骤:(1)对面向不确定数据的多准则信息查询进行等价重写;(2)对概率关系部件上的多准则信息查询进行优化;(3)查询优化器生成概率关系部件上多准则信息查询执行计划;(4)查询处理器根据步骤(3)生成的计划对面向不确定数据的多准则信息进行查询,并将结果通过显示器显示。所述的步骤(1)对面向不确定数据的多准则信息查询进行等价重写包括以下步骤:1)同个关系对象的多个概率实例被组织成一张带约束条件的G-Tabset信息表;2)被因子分解成多项式个数的概率关系部件,其中每个概率关系部件为若干个概率关系表实例的合取,其中概率关系部件集W={WSD1,...,WSDn本文档来自技高网
...

【技术保护点】
1.一种不确定数据上的多准则信息处理方法,其特征在于,包括以下步骤:(1)对面向不确定数据的多准则信息查询进行等价重写;(2)对概率关系部件上的多准则信息查询进行优化;(3)查询优化器生成概率关系部件上多准则信息查询执行计划;(4)查询处理器根据步骤(3)生成的计划对面向不确定数据的多准则信息进行查询,并将结果通过显示器显示。

【技术特征摘要】
1.一种不确定数据上的多准则信息处理方法,其特征在于,包括以下步骤:
(1)对面向不确定数据的多准则信息查询进行等价重写;
(2)对概率关系部件上的多准则信息查询进行优化;
(3)查询优化器生成概率关系部件上多准则信息查询执行计划;
(4)查询处理器根据步骤(3)生成的计划对面向不确定数据的多准则信息进
行查询,并将结果通过显示器显示。
2.根据权利要...

【专利技术属性】
技术研发人员:黄震华向阳张波陈千王栋刘立平伍申申
申请(专利权)人:同济大学
类型:发明
国别省市:31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1