具有多个源容量的数据检索方法和装置制造方法及图纸

技术编号:2888699 阅读:198 留言:0更新日期:2012-04-11 18:40
一种计算机实施的方法,其特征在于,包括: 提供第一驱动程序,它发出访问可能被存储在第一或第二不同数据源中的数据的指令,所述第一驱动程序包括构成以供结合所述第一数据源一起使用的程序指令;和 运用所述第一驱动程序,以自动获得关于所述第一数据源的所述数据结构的信息,而无需对所述第一数据源作人工分析。(*该技术在2016年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】本申请是美国专利申请第08/593,118号的部分继续申请(1996年2月1日申请),所述申请是美国专利申请第08/582,062号的部分继续申请(代理人文件号23134/90100,于1995年12月20日申请,专利技术名称为“具有多个源容量的数据检索方法和装置”),列入于此,以作参考。本专利技术涉及计算机实现系统,它能够检索存储在一个或多个不同源中并以多种不同格式中的任一种格式的信息,而且能够提供基于该信息的报告及分析,特别是,涉及计算机方法和装置,它能够自动检索以多种格式中的任一种格式存储的数据库信息(包括结构和/或相关信息),而无需依赖于源数据的人为分析。
技术介绍
计算机可存取信息的方法已开发出多种,诸如,相关或层次结构数据库管理系统、展开文件数据系统、电子数据表系统等。这些系统用于存储、操纵和显示无数种信息,包括会计或其它财务信息、科学或技术数据、公司或商业上的数据、名称、地址和电话数据和统计数据。至今已开发了多种格式和数据结构,而且这种情况既有好的一面,也有不好的一面。从积极的一面来看,由于具有多种不同类型的系统,能够为不同的系统提供不同的优质支持(例如,为数据进入或存储与数据分析和报告的速度或灵活性之间的关系作优化,或者为会计数据与公司数据等之间的关系作优化),或者向用户提供能够吸引个人或公司偏爱的用户界面或者其它特性。然而,在可以同时访问两个或多个这种系统中的信息(例如,协调或组合这些信息)是十分有用的情况下,这种信息系统的不断增多却是一种实质上的屏障。这种情况的例子包括(1)一个想要做出标准化报表的会计师,他拥有多个客户,但每个客户都保留着他们各自不同类型的数据源中的会计数据;(2)具有几个分部的公司,它希望做出统一报表,但其中不同分部运用不同的公司或财务软件;(3)希望做出统一报表的公司,它的会计信息是第一种型号或牌子的数据库(或其它数据源)上的而它的公司信息却是第二种型号的数据库上的;(4)一组调查同一个问题的科学家,每个科学家存储或利用保留在不同类型或牌子数据库或其它数据源中的数据。在理解本说明书后,读者还可能遇到其它类似的例子。此外,在某些情况下,即使当把所有所需信息存储在单个类型的数据源或者在单个数据文件中,也需要提供访问数据的方法(例如,提供对于数据的一致和/或促进的报告和分析)。由于多种理由(包括,组织信息方法的不同和数据源类型之间的不同),使得这种情况十分困难。在一些情况下,即使运用相同的数据库软件,也可以用不同的方法组织类似类型的信息。例如,在第一个例子中,运用第一数据库软件包,用户可以组织公司的个人记录,从而把公司的所有人的姓名存储在第一张表或清单中、把所有人的地址存储在第二张表或清单中和把所有人的电话号码存储在第三张表或清单中,而且存储指针或链路以表明姓名与哪个地址和哪个电话号码相关。然而,可能发生运用相同软件的另一个例子,其中组织个人信息的不同的人可能提供单个表,其中每根线或信息“记录”包括姓名、地址和电话号码,无需从一张表中的记录到另一张表中的记录的任何链路或指针。此外,不同类型的数据可以具有不同结构和/或不同数据存储格式或方案。例如,用层次结构的方法(例如,用树形结构)组织一些软件包,而其它的软件包可以组织为关系数据库形式(在行和列的两维表上建模)。此外,可以这种形式(严格地说,不是以数据库形式,诸如,以“平面文件”形式存储数据)存储信息作为电子数据表等。此外,不同类型的数据源可以各种格式存储数据。例如,一些数据库产品(database produces)存储每张表格、每个报告格式和每个查询作为在存储装置(诸如,硬盘)上的分别的文件,而其它软件可以把所有表格、关系、查询、表格格式等存储在单个文件中。一些产品可以存储每个记录和/或字段地作为固定长度数据和/或在文件中的固定位置上,而其它产品可以运用定界符以区分一个记录和下一个记录或区分一个记录内的一个字段和下一个字段。即使不同的软件产品存储在预定上的特定类型信息,对于不同的软件产品这种位置可以是不同的。此外,在不同软件产品中对数据进行不同编码,诸如,在一个产品中运用ASCII编码,而在另一个产品中运用多音(多字节)字符。在一些情况下,可以压缩数据和/或对其进行编码。过去,由于数据类型十分不同,当需要访问存储的信息(例如,使报表标准化和分析和/或组合或协调来自两个或多个数据库的信息)时,顾问或其它专家个人地或“手工地”分析每个“源”数据文件或数据库以理解它的结构、关系数据存储格式、在数据库内的数据组织等。然后,专家建立一些输入方法或者查询在源数据文件或数据库中的数据,以获得所需的存取、协调或组合。虽然,这种方法是可操作的,但是由于它需要人为分析,它是很费力又费时的,而且由于对于专家或顾问要完成分析工作一般需要很长的时间,通常需要几天或几个星期来进行存取、协调或组合。因此,提供经组合和/或协调的系统,其中,可以访问以各种格式或形式或以各种方法组织的信息,同时减小或者不需要人为分析,从而提供一种系统,它至少是部分自动,而且比起某些现有方法来是不费力也不费时。专利技术概述本专利技术涉及访问存储信息的系统,例如,在两个不同信息存储系统中访问信息或获得协调和/组合。较佳的是,在一个实施例中,运用适当的编程计算机,自动执行所包括的一些或所有分析(即,无需人工分析)。较佳的是,系统是很灵活的,其中并不局限于它可以访问的格式,而是构成以获得实际上来自任何计算机可读信息源的数据。较佳的是,系统是可扩展的,(更佳的是,模块可扩展)其中可添加元件以允许访问附加类型、格式或组织的数据。在一个实施例中,访问、协调或组合数据伴随着增强对数据分析(即,提供在原始数据源中找不到的或未用到的数据分析类型和/或报告)。较佳的是,可用系统提供在几种数据源中数据分析和报告的标准化。在一个实施例中,为了获得所需结果(诸如,通过运用文本识别、人工智能和/或专家系统),系统运用源数据文件或数据库的内容,以及关于结果的信息。在一个实施例中,系统运用这种信息以至少部分控制可获得数据以对其进行分析和报告的方法。在一个实施例中,系统运用这种信息以提供这种分析和报告。提供用标准化或统一方法,生成关于包括在可以是两种或多种源数据的数据源中的信息的输出或报表。对特定的不同类型的源数据提供驱动程序,这些源数据包括为识别各种数据源的结构或其它特性(例如,以供第一新数据库使用)进行的编程。较佳的是,构成新数据库以允许高活性和/或快速输出或报告,或者为报告目的对其进行最优化。在一个实施例中,本专利技术包括把一个或多个数据源转换成一个或多个统一数据库,较佳的是,生成一个或多个关键目录表、有选择地生成种类组或累积和附加数据或可选参量。在一个实施例中,本专利技术根据会计或从已存的数据文件(诸如由以前会计或其它软件创建的数据文件)转换而来的其它数据,创建或提供数据库。在一个实施例中,将系统配置成能方便地更新一些或所有新数据库部分(诸如,通过存储应被更新的一个或多个数据简要表和/或创建或定义在预限定时间户间隔内自动执行更新过程的时间安排表)。在一个实施例中,提供能自动识别所需数据(诸如,通过当在给定数据段或数据参数中找到多个值时进行查看)的改进。较佳的是,提供一个或多个确认或审计工具以检测潜在误差本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:戴维·B·考奇戴维·F·亚内尔唐纳德K·巴布科克
申请(专利权)人:时代线路股份有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1