在不兼容的电脑间高效转换异质数据的系统技术方案

技术编号:2873498 阅读:288 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种数据转换系统,用以将一数据文件在两不兼容的电脑间高效转换。根据本发明专利技术,先根据一预定参考文件对一描述文件所记录的关于该数据文件的数据类型及数据格式自动地做语意分析并产生元数据参照文件。该预定参考文件定义了两不兼容的电脑间各类数据类型及各类数据格式转换的规则。随后,管理者可选择对元数据参照文件内所记录的数据栏目、数据类型及数据格式做修改、增加、删减、分割或合并,再产生修订后的元数据参照文件。最后,根据修订后的元数据参照文件,自动地将数据文件在不兼容的两电脑间转换。通过本发明专利技术可以将早期电脑系统中的数据高效地转至目前采用的电脑系统内,以缩短数据转换时间、降低数据转换成本,更利于后续的应用。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种数据转换系统,特别是一种在不兼容的电脑之间高效转换异质数据的数据转换系统。然而,上述可被运用的数据必须能被现行电脑系统甚至是开放式平台(Open platform)所读取。早期(Legacy)电脑系统内所储存的数据,例如IBM的大型主机(Main frame),必须经过转换为现行电脑系统所能识读的数据,才能被上述各种先进的数据应用。由于早期对于电脑的需求多为运用来储存大量的数据,因此,采用大型电脑的多为金融业以及邮政业。随着将数据转换至开放式平台的趋势,目前数据转换己成为金融业以及储存有大量仅能被早期大型主机读取的数据的单位的繁重工作。一般电脑系统对于文件结构的安排,大多是将储存在数据文件内的数据依照数据栏目排列,若该数据文件是一数据库,上述的数据栏目即为该数据库的数据字段。并且,储存在每一个数据栏目内的数据都具有一特定的数据类型以及数据格式。电脑系统在设计上多半会储存对应数据文件的描述文件,在描述文件内存有对其所对应的数据文件的数据栏目的定义、对应数据栏目的数据类型以及数据格式。对早期电脑系统(例如一主机)内所储存的数据的转换,以往的作法是先由人工对该主机所存的描述文件内所储存的信息做语意分析。接着,在主机内撰写一个转换程序(业界通称为主机程序)将数据文件先转换为中继文件。随后在目标电脑系统内撰写一支转换程序(业界通称为终端程序),将中继文件转换为目标电脑可读取的数据文件。然而,还需要载入程序的协助,才能顺利地将数据文件从主机转换至目标电脑。若是有300个数据文件欲做转换,即需要耗费时间撰写300支主机程序、300支终端程序以及300支载入程序,才能顺利地将300个数据文件做转换。明显地,现行将大型主机内的数据转换至开放式平台的作法,不但要耗费大量程序人员的人力,而且需耗费大型主机的运算资源,影响到大型主机原有需执行的工作。再以建构数据仓储系统为例,依照过去经验,数据仓储系统的建置有三分之二的时间花费在处理数据的转换上。因此,若能缩短数据转换的时间,即可大幅缩短数据仓储的建置时间。需强调的是,不仅仅是对于在早期大型主机与开放式平台间的数据转换,凡是在两不兼容的电脑系统间转换异质数据,皆会有高效率地转换数据的需求。然而,就先前技术而言,其以人工做语意分析的作法以及耗掉数据来源电脑大量运作资源的作法,明显地会降低数据转换的效率。根据本专利技术的第一较佳具体实施例,一种数据转换系统是提供来将一数据文件从一第一电脑转换至一第二电脑。该数据文件包含按多个栏目排列的数据,储存在该多个栏目中的每一个栏目内的数据具有一特定的第一数据类型以及一特定的第一数据格式。所有的第一数据类型以及所有的第一数据格式可被该第一电脑识读,但不可被该第二电脑识读。一描述文件储存于该第一电脑内,描述了该多个栏目的定义以及相对应的第一数据类型与第一数据格式。一预定参考文件是事先提供的,且定义了该第一电脑与该第二电脑之间各类数据类型及各类数据格式转换的规则。根据本专利技术的较佳具体实施例,首先从该第一电脑处撷取该描述文件。接着根据该预定参考文件,对该描述文件内所的所有第一数据类型以及所有第一数据格式做语意分析,进而产生一第一元数据参照文件。该第一元数据参照文件包含该多个栏目的定义、多个中间数据类型以及多个中间数据格式。该多个中间数据类型中的每一个中间数据类型可被该第二电脑识读,并且对应该多个第一数据类型中的一个第一数据类型。该多个中间数据格式中的每一个中间数据格式可被该第二电脑识读,并且对应该多个第一数据格式中的一个第一数据格式。随后,选择性地修改该多个中间数据类型以及该多个中间数据格式,进而修改成为多个第二数据类型以及多个第二数据格式,并产生一第二元数据参照文件来代替该第一元数据参照文件。该第二元数据参照文件包含了该多个栏目的定义、该多个第二数据类型以及该多个第二数据格式,其中,每一个第二数据类型可被第二电脑识读,并且对应该多个第一数据类型中的一个第一数据类型,每一个第二数据格式可被第二电脑识读,并且对应该多个第一数据格式中的一个第一数据格式。最后,根据该第二元数据参照文件,将该数据文件内的数据从该第一电脑转换至该第二电脑,使在该第二电脑内该数据文件所转换的数据是依照该多个栏目、每一个栏目所对应的第二数据类型以及对应的第二数据格式排列。关于本专利技术的优点与精神可以通过以下的专利技术详述及附图进行进一步说明。附图说明图1描绘了根据本专利技术的第一较佳具体实施例的数据转换系统10的结构。该数据转换系统10分别与一第一电脑20(即储存原数据文件的来源电脑)以及一第二电脑30(即数据文件欲转换到的目标电脑)连结,用以将一数据文件从该第一电脑20处转换至该第二电脑30处。该数据文件包含依据多个栏目排列的数据。若该数据文件是一数据库,上述的栏目即为该数据库的数据字段。储存在该多个栏目中每一个栏目内的数据具有一特定的第一数据类型(例如,单字节数据类型、双字节数据类型或其他特殊的数字数据类型等)以及一特定的数据格式(例如,小数点位数或货币种类等)。需注意的是,所有的第一数据类型以及所有的第一数据格式可被该第一电脑20识读,但不可被该第二电脑30识读。储存在该第一电脑20中的一描述文件(Description file)描述了该多个栏目的定义以及相对应的第一数据类型与第一数据格式。事先提供的一预定参考文件(Reference file)用于定义该第一电脑20与该第二电脑30之间各类数据类型及各类数据格式转换的规则。在一具体实施例中,该第一数据类型包含选自从EBCDIC数据类型、New Host Code数据类型、Comp数据类型及Comp-3数据类型所组成的一组当中的一个数据类型。在一具体实施例中,该第二电脑30是一开放式平台(Open platform),例如,Microsoft的NT平台。如图1所示,该数据转换系统10包含一输入模块11、一语意分析模块12、一元数据参照文件储存模块14、一编辑模块16以及一数据转换模块18。该输入模块11是用以从该第一电脑20处撷取该描述文件及该数据文件。该语意分析模块12储存该预定参考文件,并且从输入模块11处接收该描述文件。根据该预定参考文件,该语意分析模块12对该描述文件内的所有第一数据类型以及所有第一数据格式做语意分析(Parsing),并产生一第一元数据参照文件(Metadata)。该第一元数据参照文件包含了该多个栏目的定义、多个中间数据类型以及多个中间数据格式。需注意的是,该多个中间数据类型中的每一个中间数据类型可被该第二电脑30识读,并且对应该多个第一数据类型中的一个第一数据类型。该多个中间数据格式中的每一个中间数据格式可被该第二电脑30识读,并且对应该多个第一数据格式中的一个第一数据格式。该元数据参照文件储存模块14是用以储存该第一元数据参照文件。需强调的是,不同于先前技术,根据本专利技术的数据转换系统10中的语意分析系统是自动对描述文件内的信息做语意分析,而非以传统的人工的方式进行。单就此点,就已免除了先前技术需由程序员以人工方式对描述文件做语意分析,以及由程序员撰写在该第一电脑内执行的转换程序的过程。明显地,此种作法免除了先前技术所需大量的程序员人力,并且大幅度地缩短了整体数据转换的本文档来自技高网...

【技术保护点】
一种在不兼容的电脑间高效转换异质数据的数据处理系统,用以将一数据文件从一第一电脑转换至一第二电脑,该数据文件包含依据多个栏目排列的数据,储存在该多个栏目中每一栏目内的数据都有一特定的第一数据类型及一特定的第一数据格式,所有第一数据类型和所有第一数据格式能被该第一电脑识读,但不能被该第二电脑识读,储存在该第一电脑内的一描述文件描述了该多个栏目的定义和相对应的第一数据类型与第一数据格式,事先提供的一预定参考文件定义了在该第一电脑与该第二电脑之间各类数据类型及各类数据格式转换的规则,其特征在于,该数据处理系统包含:一输入模块,用以从该第一电脑处撷取该描述文件及该数据文件;一语意分析模块,用以储存所述的预定参考文件,并从输入模块处接收所述的描述文件,并根据该预定参考文件,对该描述文件内的所有第一数据类型和所有第 一数据格式做语意分析,并产生一第一元数据参照文件,该第一元数据参照文件包含该多个栏目的定义、多个中间数据类型以及多个中间数据格式,其中每一个中间数据类型可被该第二电脑识读,并对应该多个第一数据类型中的一个第一数据类型,每一个中间数据格式可被该第二电脑识读,并且对应该多个第一数据格式中的一个第一数据格式;一元数据参照文件储存模块,用以储存该第一元数据参照文件;一编辑模块,用以从该元数据参照文件储存模块处撷取该第一元数据参照文件,并选择性地将该多个中间数据类型和该多个中间 数据格式修改为多个第二数据类型和多个第二数据格式,再产生一第二元数据参照文件,并回存至该元数据参照文件储存模块,以代替该第一元数据参照文件,该第二元数据参照文件包含该多个栏目的定义、该多个第二数据类型以及该多个第二数据格式,其中每一个第二数据类型可被该第二电脑识读,并且对应该多个第一数据类型中的一个第一数据类型,每一个第二数据格式可被该第二电脑识读,且对应该多个第一数据格式中的一个第一数据格式;以及一数据转换模块,用以从该输入模块处接收该数据文件和从该元数据参照文件储存模 块处撷取该第二元数据参照文件,并根据该第二元数据参照文件,将该数据文件内的数据从该第一电脑转换至该第二电脑,使在该第二电脑内该数据文件的所转换的数据是依照该多个栏目、每一个栏目所对应的第二数据类型以及每一个栏目所对应的第二数据格式排列。...

【技术特征摘要】

【专利技术属性】
技术研发人员:王惠中
申请(专利权)人:锦华资讯科技股份有限公司
类型:发明
国别省市:71[中国|台湾]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利