从一个或多个数据存储位置获得用户特定关注数据的概念利用制造技术

技术编号:13085041 阅读:67 留言:0更新日期:2016-03-30 16:23
提供一种从已被编索引的较大数据集获得关注数据的计算机实施的方法,所述方法包括经由计算设备的用户接口定义与概念相关联的属性集。与所述概念相关联的每个属性被映射至与编索引后的数据相关联的属性,且基于与所述概念相关联的属性至与所述编索引后的数据相关联的属性的映射来检索与所述概念相关的关注数据。

【技术实现步骤摘要】
【国外来华专利技术】对相关申请的交叉参考本申请要求2013年8月15日提交的美国临时专利申请第61/866,202号的优先权;且要求2013年8月15日提交的美国临时专利申请第61/866,258号的优先权;其每一者的全文以引用的方式并入本文中。
本专利技术的实施例涉及数据管理,具体地说,涉及提供一种对在一个或多个数据存储库内管理的数据编索引并检索所述数据以便按期望细节级别且基于用户偏好来提供数据的机制。
技术介绍
法律文件、归因于法务存储措施或含有对律师问题的答复而可需要保留的文件以及商业或法规文件是许多行业需要数据挖掘及控制辅助的实例市场划分。由于公司产生的数字数据量正每年以显著速率(例如,60%至120%)增长,因此信息技术(IT)主管及职员在控制与管理所述数据相关联的成本时承受极大压力。可藉由理解正被管理的数据、需要被保留的数据及可被安全且永久地删除的数据的类型来完成期望成本目标。此外,鉴于存储库内的大量数据,针对特定用途高效地存取数据及关于数据的信息(或元数据)是困难的。具体地说,一个用户可需要存取不同于另一用户的需要的特定数据子集(例如,用户可需要找到属于Fred但不属于Jane的文件)。可要求用户将业务概念(例如,身份、部门、供应商等)手动地转换成存取该业务概念所要求的特定类型数据(或元数据)所需的过滤器及其他工具,此可为冗长且低效的过程。
技术实现思路
根据本专利技术的一个实施例,提供一种从已被编索引的较大数据集获得关注数据的计算机实施的方法,所述方法包括经由计算设备的用户接口定义与概念相关联的属性集。与所述概念相关联的每个属性被映射至与编索引后的数据相关联的属性,且基于与所述概念相关联的属性至与编索引后的数据相关联的属性的映射来检索与所述概念相关的关注数据。附图说明通常,各图中的类似参考数字用以指定类似组件,这些附图是:图1为本专利技术的实施例的实例计算环境的图解说明;图2为根据本专利技术的实施例的创建信息集的实例方式的流程图;图3为根据本专利技术的实施例的用于选择源信息集的实例图形用户接口屏幕的示意性说明;图4为根据本专利技术的实施例的用于选择用于从源信息集创建信息集的过滤器的实例图形用户接口屏幕的示意性说明;图5为根据本专利技术的实施例的用于键入信息集的名称及其他元数据的实例图形用户接口屏幕的示意性说明;图6为根据本专利技术的实施例的对由信息集指定的数据应用操作的实例方式的流程图;图7为根据本专利技术的实施例的用于选择用以对由信息集指定的数据应用的操作的实例图形用户接口屏幕的示意性说明;图8为根据本专利技术的实施例的展示生成并定义概念以用于从数据存储库获得与所述概念相关联的期望数据的管理流程的流程图;图9为根据本专利技术的实施例的展示用户选择概念以从数据存储库获得期望数据的流程图;图10为根据本专利技术的实施例的展示在图1的计算环境中实施的概念引擎实施概念以生成一个或多个数据集的方式的流程图;图11至图13提供根据本专利技术的实施例的用于选择并使用概念的实例图形用户接口屏幕的示意性说明。具体实施方式本专利技术的实施例关于各种数据存储库内数据的管理,同时允许数据在这些存储库中保持完好。关于数据的信息(或元数据)被提取,且被插入至与数据存储库的数据分离地存储的索引中。本专利技术的实施例包括用于从数据存储库检索信息及元数据的构架。经由被验证为可检索数据且在一些实例中改变数据的适配器存取个体数据存储库。用户可提供其自己的用于定义信息集(或所管理数据子集)以包括用户关注的信息的规则,且指示对所定义信息集的参考,藉此允许实现跨越不同访问方法及不同存储库的存取规则。举例而言,用户可对存储于UNIX文件系统及WINDOWS文件系统中的数据感兴趣。用户可命名并存储具有所要结果数据的信息集以便稍后存取该数据。藉由将基于所收集的信息的过滤器应用于所管理数据来创建信息集内的数据。此所收集信息提供一定程度的理解,从而使得用户能够识别对于使用状况是特定的或感兴趣的数据。本专利技术的实施例进一步允许实现收集用于做出决策或执行任务的特定数据,而不必理解关于底层的特定数据放置及数据访问方法的细节。具体地说,本专利技术的实施例可如本文中进一步详细地描述而利用概念来生成信息集,所述概念定义并表示信息的类别或类型,信息的类别或类型表示用户关注的一个或多个业务对象。概念由描述并区分概念的组成项(constituent)的属性集来定义,且属性被映射至藉由对一个或多个数据存储库进行数据收集而获得的编索引后的数据的属性。组成项也与所定义概念相关联,且利用所定义的概念及相关联的组成项来实施信息集的创建。本专利技术的实施例可确保效率,其中昂贵或耗时的操作仅在必要时执行且仅对受管理的总体数据的指定子集执行。举例而言,信息技术(IT)职员可藉由仅从文件、电子邮件、共同协作或其他服务器收集系统元数据而开始。所收集的信息包括与信息相关联的一个或多个索引,所述信息用以将所定义的概念的属性映射至索引内的属性,以便允许用户存取信息集内的与特定概念对应的数据。本专利技术的实施例提供若干优点,所述优点包括(但不限于):外部用户能够定义当概念应用至其特定情境或情形(亦即,使用状况)时概念的含义;根据本专利技术定义概念向用户提供了一种在不需要知晓最初存储数据的方式及地点的细节的情况下检索关于数据的信息的方式;以及所定义概念促进对于编索引后的数据(来自数据收集)的复杂查询的执行,因此减少存储及用以检索对特定查询的答案的时间(以及使用户免受与概念相关联的复杂性的困扰)。本文中最初描述实例实施例,从而展示可如何利用实例系统架构来生成信息集(如图1中所描绘)。接着,用于定义并利用用于存取数据存储库内的数据的概念的实例实施例在获得信息集的内容上下文中予以描述。然而,请注意,本专利技术不限于这些实例实施例,因为如本文中所描述地使用概念从数据存储库获得与所述概念相关的数据亦可利用其它合适技术来实施。在图1中说明与本专利技术的实施例一起使用的一个实例环境。所述环境提供针对在数据存储库内保持完好的数据的数据管理。具体而言,所述环境包括应用服务器系统(或应用堆栈)2000、网关系统2100、一个或多个数据服务器系统2200,及一个或多个客户端或终端用户系统以使得用户和/或管理员能够存取各种数据管理服务。应用服务器系统、网关系统、数据服务器系统及客户端系统可彼此远离,且经由网络通信。网络可藉由任何...

【技术保护点】
一种从已编索引后的较大数据集获得关注数据集的计算机实施的方法,所述方法包括:经由计算设备的用户接口定义与概念相关联的属性集,所述概念定义并表示信息类别,所述信息类别表示业务对象;将与所述概念相关联的每个属性映射至与所述编索引后的数据集相关联的属性;及基于所述映射检索与所述概念相关的数据集。

【技术特征摘要】
【国外来华专利技术】2013.08.15 US 61/866,202;2014.04.01 US 14/242,2171.一种从已编索引后的较大数据集获得关注数据集的计算机实施的
方法,所述方法包括:
经由计算设备的用户接口定义与概念相关联的属性集,所述概念定义
并表示信息类别,所述信息类别表示业务对象;
将与所述概念相关联的每个属性映射至与所述编索引后的数据集相关
联的属性;及
基于所述映射检索与所述概念相关的数据集。
2.如权利要求1所述的方法,其中所述概念包括以下项中的至少一个:
身份、公司部门、组织、公司供应商、与公司相关联的产品、项目、及监
管人。
3.如权利要求1所述的方法,其中所检索数据集的数据记录与一个或
多个数据存储库相关联,每个存储库具有存取接口。
4.如权利要求1所述的方法,进一步包括:
利用适配器来检索所述数据集,所述适配器与利用所述概念的检索查
询相关联。
5.如权利要求1所述的方法,其中检索数据集进一步包括:基于准则
过滤所检索的数据集,使得不与所述准则匹配的数据被排除在所述数据集
外。
6.如权利要求1所述的方法,包括:
存储与所述概念相关联的所述属性集;
存储与所述概念相关联的每个属性至与所述编索引后的数据集相关联
的所述属性的映射;及
将所存储的属性集及所存储的映射用于后续数据检索。
7.如权利要求1所述的方法,其中定义进一步包括:
定义与概念相关联的第一属性集;
定义与所述概念相关联的第二属性集;
将所述第一属性集及所述第二属性集映射至与所述编索引后的数据集
相关联的属性;及
检索与所述概念相关的第一数据集及第二数据集,使得与所述第一属
性集相关联的所述第一数据集及与所述第二属性集相关联的所述第二数据
集彼此不同。
8.如权利要求1所述的方法,包括将组成项添加至所述概念,其中所
述组成项是与所述概念相关联的数据的实例。
9.如权利要求1所述的方法,进一步包括自动地创建对应于所检索的
数据集的信息集。
10.一种系统,包括:
存储器;
计算设备的用户接口,其用于接收用于定义属性集的信息并且接收映
射信息;及
处理器,其被配置为:
将属性集与概念相关联,所述概念定义并表示信息类别,所述信息类
别表示业务对象;
将与所述概念相关联的每个属性映射至与编索引后的数据集相关联的
属性;及
基于所述映射检索与所述概念相关的关注数据集。
11.如权利要求10所述的系统,其中所述处理器被配置为检索包括数
据记录的数据集,所述数据记录与一个或多个数据存储库相关联,每个存
储库具有存取接口。
12...

【专利技术属性】
技术研发人员:R·W·阿诺德T·P·毕舍普O·O·艾修J·R·麦考伊
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1