Including the method, the present invention relates to automatically generate the XML file to a database of data: provides definitions for specific data structure XML documents generated; based on the XMLSchema file to complete the blank XML template to generate the complete set goals; generated in the blank XML template based on XML file node attributes and corresponding database the table field information of the mapping, and the attribute mapping information is written to the corresponding XML blank template in the value of the database; data extraction; data extraction will automatically fill in batch XML blank template to generate the required specific data structure XML file. The invention automatically generates XML files that need specific data structures, and solves the complex problem that a single data table may have tens of thousands or even millions of records with the continuous growth of database data. It needs to generate a large number of XML files.
【技术实现步骤摘要】
一种抽取数据库数据自动批量生成所需XML文件的方法
本专利技术涉及一种抽取数据库数据自动批量生成所需XML文件的方法,属于计算机信息技术处理
技术介绍
XML又称为可扩展标记语言(eXtensibleMarkupLanguage),是由W3C组织于1998年2月发布的一种标准。作为SGML的一个简化子集,它集成了SGML丰富功能及HTML易用性的特点,以一种开放、自描述的方式定义数据结构。XML可以同时描述数据内容和结构特性,通过这些结构特性,可以了解数据之间的语义关系。HTML文件中的标识符仅用于控制如何显示内容(如字体的大小等等),文件内容所表达的意义完全需要人通过对文字的阅读才能理解。而XML则不同,它所用的标识符本身就蕴含相应的语义信息,文件内容所表达的具体含义完全可通过对语义的分析由机器来解释。因此,HTML与XML之间的差别可以通俗的概括为:“HTML是写给人看的;而XML则是写给机器看的,与SGML相比,XML更简单,同时也可用于设计文档描述语言。XML自描述的特点使其自诞生之日起就引起了学术界和工业界的广泛关注并随着网络应用的爆炸式增长而 ...
【技术保护点】
一种抽取数据库数据自动批量生成所需XML文件的方法,其特征在于:包括如下步骤:步骤1、通过XMLSchema文件定义模块对所需要生成的XML文档进行定义,生成对应的XSD文件;步骤2、通过步骤1生成的XSD文件通过XML空白模版生成模块进行XML空白模版的生成;步骤3、通过包含数据配置信息的XML文件生成模块编写XML文件数据节点与数据库库表映射信息的配置文件;步骤4、通过步骤3的配置文件生成包含数据配置信息的XML模版;步骤5、通过数据库数据抽取模块读取步骤4的配置文件数据配置信息并利用多线程及线程池技术进行对应数据库数据信息的抽取工作,这里进行批量的抽取数据,并将这些抽 ...
【技术特征摘要】
1.一种抽取数据库数据自动批量生成所需XML文件的方法,其特征在于:包括如下步骤:步骤1、通过XMLSchema文件定义模块对所需要生成的XML文档进行定义,生成对应的XSD文件;步骤2、通过步骤1生成的XSD文件通过XML空白模版生成模块进行XML空白模版的生成;步骤3、通过包含数据配置信息的XML文件生成模块编写XML文件数据节点与数据库库表映射信息的配置文件;步骤4、通过步骤3的配置文件生成包含数据配置信息的XML模版;步骤5、通过数据库数据抽取模块读取步骤4的配置文件数据配置信息并利用多线程及线程池技术进行对应数据库数据信息的抽取工作,这里进行批量的抽取数据,并将这些抽取的数据放入服务器缓存当中;步骤6、通过填充生成目标XML模块将步骤5抽取的批量数据信息进行加工,读取包含数据配置信息的XML文件,按照配置信息批量完成所需特定数据结构的XML文件的生成。2.根据权利要求1所述的一种抽取数据库数据自动批量生成所需XML文件的方法,其特征在于:所述XMLSchema文件定义模块对XSD文件定义了一个元数据初始节点元素Metadata,type类型为复合元素,指向复合元素Metadata;复合元素Metadata有两个元素,一个元素为一般元素mdFileID,代表元数据的唯一标识ID,type为String类型,最大出现次数maxOccurs为一次;另一个元素mdExtInfo,type类型为复合类型MdExtInfo,指向复合元素MdExtInfo,最大出现次数maxOccurs为一次;复合元素MdExtInfo只有一个对象属性信息元素obj_att,type为String类型,不限制该元素最大出现次数,即该元素可以不出现也可以出现多次。3.根据权利要求1所述的一种抽取数据库数据自动批量生成所需XML文件的方法,其特征在于:所述XML空白模版生成模块用于根据提供的XMLSchema文件完成完整的空白XML模版生成,空白XML模版内容依赖于XMLSchema文件定义模块,通过解析XSD文件工具自动生成所需的空白XML文件模板;依据XSD文件生成了四个主要节点:Metadata节点、mdFileID节点、mdExtInfo节点、obj_att节点,节点mdFileID是用来存储抽取好的元数据唯一标识ID,对象属性节点obj_att用来存储对象属性信息。4.根据权利要求3所述的一种抽取数据库数据自动批量生成所需XML文件的方法,其特征在于:所述空白模版指的是:XML中每个节点都强制出现:必选项和可选项;每个属性节点没有填入任何数据信息;XML文件中每个节点有且仅出现一次。5.根据权利要求1所述的一种抽取数据库数据自动批量生成所需XML文件的方法,其特征在于:所述包含数据配置信息的XML文件生成模块用于建立目标生成的XML文件中的各节点属性与对应数据库库表字段信息的一一映射以及对应空白XML文件模板节点一一映射,是将数据库字段和空白XML模板文档结合在一起的中间配置文件;原生配置文件及包含配置信息的XML文档中,有两张表OOM_OBJMETA对象元数据表及OOM_...
【专利技术属性】
技术研发人员:冯钧,徐维纲,郭涛,陆佳民,
申请(专利权)人:河海大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。