用于分析的基于策略的数据收集处理及协商的方法与系统技术方案

技术编号:13796100 阅读:70 留言:0更新日期:2016-10-06 14:35
提供了一种鉴于分析的基于本体论策略的数据收集、处理、以及数据协商的方法。所述方法在一或多个数据源中搜索与数据请求相关的数据。所述方法从一或多个数据源收集与数据请求相关的数据。所述方法确定根据数据请求所生成的一或多个属性是否与一或多个与数据请求相关的数据所关联的描述符相匹配。所述方法为与数据请求相关的数据创建一或多个带注释的本体。所述方法显示与数据请求相关的数据的一或多个带注释的本体的层次结构的视频表示。所述方法至少部分地根据对一或多个数据选择的质量的评估,更新与数据请求相关的数据的一或多带注释的本体。

【技术实现步骤摘要】

总体上讲,本专利技术涉及数据分析,更具体地讲,本专利技术涉及鉴于分析的、基于本体论策略的数据收集、数据处理、以及数据协商。
技术介绍
本体论为一种用于描述由一组类型、特征、以及关系组成的范畴的方法的模型。根据一个分类系统,本体可以代表实体、概念、和事件、以及它们的特征与关系。域本体(即,域特定的本体)代表属于所述范畴的一部分的概念。域本体提供了适用于一个域的术语的具体含义。例如,单词“卡”具有许多不同的含义。有关扑克的域的本体可以模型化单词“卡”的“玩牌”含义,而有关计算机硬件的域的本体可以模型化“卡”的“视频卡”含义。由于域本体以非常具体的且通常折衷方式表示概念,所以它们通常是不兼容的。当依赖于域本体的系统扩展时,它们常常需要把域本体合并成一个更一般的表示。这对本体设计者提出了挑战。由于不同的语言、对本体的不同意图的使用、以及对域的不同的理解,同一域中会产生不同的本体(取决于文化背景、教育程度、思维方式等)。
技术实现思路
本专利技术的实施例的各个方面公开了鉴于分析的基于本体论策略的数据收集、处理、以及数据协商的方法、系统、以及计算机程序产品。所述方法包括:由一或多个计算机处理器搜索一或多个与数据请求相关的数据的数据源。所述方法包括:由一或多个计算机处理器从一或多个数据源收集与数据请求相关的数据。所述方法包括:由一或多个计算机处理器确定根据数据请求所生成的一或多个属性是否与一或多个与数据请求相关的数据所关联的描述符相匹配。响应于根据数据请求所生成的一或多个属性与一或多个与数据请求相关的数据所关联的描述符相匹配的确定,所述方法包括:由一或多个计算r/>机处理器为与数据请求相关的数据创建一或多个带注释的本体。所述方法包括:由一或多个计算机处理器显示与数据请求相关的数据的一或多个带注释的本体的层次结构的视频表示。所述方法包括:由一或多个计算机处理器至少部分地根据对一或多个数据选择的质量的评估,更新与数据请求相关的数据的一或多个带注释的本体。附图说明图1是说明了根据本专利技术实施例的数据处理环境的功能结构图(总体指定为100)。图2是描述了根据本专利技术实施例的用于分析的基于策略的数据收集、处理、以及协商的数据服务的示范性过程流程的流程图(总体指定为200)。图3是描述了根据本专利技术实施例的用于分析的基于策略的数据收集与预处理的数据服务的操作步骤的流程图(总体指定为300)。图4是描述了根据本专利技术实施例的用于显示一或多个带注释的本体的层次结构的视频表示的数据服务操作步骤的流程图(总体指定为400)。图5描述了根据本专利技术实施例的云计算节点示例的示意图(总体指定为500)。图6描述了根据本专利技术实施例的说明性的云计算环境(总体指定为600)。图7描述了根据本专利技术实施例的云计算环境所提供的一组功能抽象层(总体指定为700)。具体实施方式本专利技术的实施例认识到对于用于流的数据的适当的标识与选择,云数据收集具有有限的能力,因此,数据提供商通常对用于相关分析的有用点之外的数据流加以限制。本专利技术的实施例还认识到数据的智能标记和精细粒度选择为数据提供商和数据消费者之间的数据选择、数据收集、以及数据协商提供了机会。本专利技术的实施例提供了这样的能力:鉴于基于数据提供商和数据消费者之间的协商的定制数据选择和数据收集,以基于离线策略的数据自动标记和在线小粒度数据标记支持数据提供商。本专利技术的实施例提供了这样的能力:鉴于基于源预览数据和与相关分析相关的本体论策略的相关分析,预处理数
据。本专利技术的实施例提供了本体的层次结构的视频化表示,以允许数据消费者调查和选择与相关分析相关的数据。本专利技术的实施例提供了向数据提供商通知数据请求,以附加地手工配置本体论策略的能力。本专利技术的实施例向数据消费者提供了评估具体数据提供商的数据的质量的能力。这样的实施例的实现可以采用各种形式,接下来将参照附图讨论示范性实现的细节。以下,将参照附图详细地描述本专利技术。图1是说明了根据本专利技术实施例的数据处理环境的功能结构图(总体指定为100)。图1仅提供了对一个实现的说明,并不意味着对其中可以实现不同实施例的环境的任何限制。本领域技术人员可以在不背离权利要求所阐述的本专利技术的范围的情况下,对所描述的环境进行诸多修改。数据处理环境100包括网络102、服务器104、数据提供(商)装置110、以及数据消费(者)装置112。在所述示范性实施例中,例如,服务器104可以是诸如管理服务器、web服务器的服务器计算机系统,或者能够发送与接收数据的任何其它电子设备或者计算系统。在另一个实施例中,服务器104可以为一个数据中心,该数据中心由一组网络和诸如虚拟服务器的向外方提供IT服务的服务器以及部署在虚拟服务器上的应用组成。在另一个实施例中,服务器104代表由一或多个网络互连的计算机的“云”,其中,服务器104为计算系统,当通过网络102访问时,其把成群的计算机和部件用作单一的无缝资源池。除了云计算应用之外,这是数据中心的通常的实现。在所述示范性实施例中,服务器104包括数据服务106。在所述示范性实施例中,例如,数据提供装置110可以是诸如管理服务器、web服务器的服务器计算机系统或者能够发送与接收数据的任何其它电子设备或者计算系统。在另一个实施例中,数据提供装置110可以为一个数据中心,该数据中心由一组网络和诸如虚拟服务器的向外方提供IT服务的服务器以及部署在虚拟服务器上的应用组成。在另一个实施例中,数据提供装置110代表由一或多个网络互连的计算机的“云”,其中,数据提供装置110为计算系统,当通过网络102访问时,其把成群的计算机和部件用作单一的无缝资源池。除了云计算应用之外,这是数据中心的一个通常的实现。在所述示范性实施例中,数据提供装置110包括用户接口108(b)。在所述示范性实施例中,用户接口108(b)为传统的用户接口,用于向数据提供装置110
的用户提供与一或多个电子设备进行通信的能力。在一个实施例中,数据提供装置110可以经由诸如用户接口108(b)的用户接口与数据服务106进行通信。在所述示范性实施例中,数据提供装置110向数据服务106发送进行收集和处理的诸如云系统的票据数据的数据,以用于分析。在所述示范性实施例中,例如,数据消费装置112可以是为诸如管理服务器、web服务器的服务器计算机系统或者能够发送与接收数据的任何其它电子设备或者计算系统。在另一个实施例中,数据消费装置112可以为数据中心,该数据中心由一组网络和诸如虚拟服务器的向外方提供IT服务的服务器以及部署在虚拟服务器上的应用组成。在另一个实施例中,数据消费装置112代表由一或多个网络互连的计算机的“云”,其中,数据消费装置112为计算系统,当通过网络102访问时,其把成群的计算机和部件用作单一的无缝资源池。除了云计算应用之外,这是数据中心的通常的实现。在所述示范性实施例中,数据消费装置112包括用户接口108(a)。在所述示范性实施例中,用户接口108(a)为传统的用户接口,用于与一或多个电子设备进行交互。在所述示范性实施例中,数据消费装置112经由诸如用户接口108(a)的用户接口请求具体的数据,并且对从数据服务106中为某一分析方案所提供的数据的质量进行评估。在所述示范性实施例中,网络1本文档来自技高网...

【技术保护点】
一种用于鉴于分析的、基于本体论策略的数据收集、处理、以及数据协商的方法,所述方法包含:由一或多个计算机处理器在一或多个数据源中搜索与数据请求相关的数据;由一或多个计算机处理器从一或多个数据源收集与数据请求相关的数据;由一或多个计算机处理器确定根据数据请求所生成的一或多个属性是否与一或多个与数据请求相关的数据所关联的描述符相匹配;响应于根据数据请求所生成的一或多个属性与一或多个与数据请求相关的数据所关联的描述符相匹配的确定,由一或多个计算机处理器为与数据请求相关的数据创建一或多个带注释的本体;由一或多个计算机处理器显示与数据请求相关的数据的一或多个带注释的本体的层次结构的视频表示;以及由一或多个计算机处理器至少部分地根据对一或多个数据选择的质量的评估,更新与数据请求相关的数据的一或多个带注释的本体。

【技术特征摘要】
2015.03.20 US 14/664,2251.一种用于鉴于分析的、基于本体论策略的数据收集、处理、以及数据协商的方法,所述方法包含:由一或多个计算机处理器在一或多个数据源中搜索与数据请求相关的数据;由一或多个计算机处理器从一或多个数据源收集与数据请求相关的数据;由一或多个计算机处理器确定根据数据请求所生成的一或多个属性是否与一或多个与数据请求相关的数据所关联的描述符相匹配;响应于根据数据请求所生成的一或多个属性与一或多个与数据请求相关的数据所关联的描述符相匹配的确定,由一或多个计算机处理器为与数据请求相关的数据创建一或多个带注释的本体;由一或多个计算机处理器显示与数据请求相关的数据的一或多个带注释的本体的层次结构的视频表示;以及由一或多个计算机处理器至少部分地根据对一或多个数据选择的质量的评估,更新与数据请求相关的数据的一或多个带注释的本体。2.根据权利要求1所述的方法,其中,在数据源中搜索一或多个与数据请求相关的数据还包含:由一或多个计算机处理器根据数据请求生成一或多个属性;以及由一或多个计算机处理器在一或多个数据源中搜索与一或多个属性相关的数据。3.根据权利要求2所述的方法,其中,收集与一或多个属性相关的数据还包含:由一或多个计算机处理器从所述数据抽取一或多个描述符,其中一或多个描述符描述和标识所述数据;由一或多个计算机处理器为具有一或多个描述符的数据增殖数据描述符模板;以及由一或多个计算机处理器确定一或多个为所述数据定义域的本体。4.根据权利要求3所述的方法,其中,确定一或多个为所述数据定义域的本体还包含:由一或多个计算机处理器发现一或多个相关本体描述符;以及由一或多个计算机处理器把一或多个相关本体描述符与来自所述数据的一或多个描述符相关联。5.根据权利要求1所述的方法,其中,确定根据数据请求所生成的一或多个属性是否与一或多个与数据请求相关的数据所关联的描述符相匹配至少包含下列之一:由一或多个计算机处理器确定根据数据请求所生成的属性与一或多个与数据请求相关的数据所关联的描述符相匹配,其中,可得数据的一或多个特征的至少之一与根据数据请求所生成的一或多个属性的至少之一相关;以及由一或多个计算机处理器确定根据数据请求所生成的属性不与一或多个与数据请求相关的数据所关联的描述符相匹配,其中,可得数据的一或多个特征的至少之一不与根据数据请求所生成的一或多个属性的至少之一相关。6.根据权利要求1所述的方法,其中,为与数据请求相关的数据显示一或多个本体的层次结构的视频表示,还包含:由一或多个计算机处理器把一或多个用户所定义的策略规则与来自与数据请求相关的数据的一或多个描述符相关联,其中,把一或多个用户所定义的策略规则与与数据请求相关的数据的一或多个描述符相关联包括确定策略规则和数据描述符之间的相关度级别;以及由一或多个计算机处理器为与数据请求相关的数据创建一或多个带注释的本体,其中,创建一或多个带注释的本体包括:把一或多个为所述数据定义域的本体与一或多个可修改的数据策略规则加以组合,以根据一或多个可修改的数据策略规则描述所述数据以及所述数据的一或多个处理要求。7.根据权利要求6所述的方法,其中,为与数据请求相关的数据创建一或多个带注释的本体,还包含:由一或多个计算机处理器使用来自与数据请求相关的数据的一或多个文档的至少一个摘要标注一或多个数据描述符,其中,使至少一个摘要标注一或多个数据描述符包括下列中的至少一个:把通过搜索一或多个数据源所生成的摘要信息相关联、把数据策略规则施加于至少一个摘要、以及修改至少一个摘要以符合相关的数据策略规则。8.根据权利要求1所述的方法,还包含:由一或多个计算机处理器至少部分地根据数据选择、数据消费装置数据策略、以及数据提供装置数据策略,对来自与数据请求相关的数据的一或多个本体的数据进行过滤,其中,过滤包括:使用来自数据消费装置数据策略和数据提供装置数据策略的一或多个可修改的数据策略规则清理来自一或多个带注释的本体的数据。9.根据权...

【专利技术属性】
技术研发人员:SA巴塞特邓豫金玟暻A西格尔CO舒尔茨A赛勒王龙
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1