分析、转换和拆分结构化数据的方法和装置制造方法及图纸

技术编号:4240615 阅读:212 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种分析结构化数据的方法和装置、转换结构化数据的方法和装置以及拆分结构化数据的方法和装置。该分析结构化数据的方法包括:利用预先定义的与上述结构化数据相对应的模式信息,对上述结构化数据进行分析和验证;其中,上述模式信息包括利用正则表达式表示的与该结构化数据的结构和验证有关的信息。在本发明专利技术中,通过利用正则表达式预先构建与诸如EDI文档的结构化数据的结构和验证有关的模式信息,而在分析过程中直接利用该模式信息获取该结构化数据的结构信息并对该结构化数据进行验证,从而能够解除分析方法和装置对于结构化数据的特定结构的依赖性。

【技术实现步骤摘要】

本专利技术涉及数据处理领域,具体地,涉及分析结构化数据(structural data)的方法和装置、转换结构化数据的方法和装置以及拆分结构化数据 的方法和装置。
技术介绍
电子数据交换(Electronic Data Interchange, EDI)是这样一组标准 其用于构建要在商务、组织、政府实体和其他团体之间以及内部进行电子 交换的信息。作为数据交换的标准手段,对于EDI来说,最重要的任务是 分析根据EDI标准所构建的EDI文档,以使业务合作伙伴能够从中获得所 感兴趣的有用信息。但是,很遗憾,如本领域技术人员所公知的,EDI文 档是一种可读性很差的基于文本的文档。与XML文档相比较,EDI文档 并不具有自描述信息。这导致在现有技术中、在对EDI文档进行分析时, 首先要根据预定的分隔符信息等获取EDI文档的结构知识,然后才能够在 该结构知识的基础上对EDI文档的具体内容进行分析。因而,在现有技术 中,缺乏一种用于分析EDI文档的、标准且灵活的机制。以WBSF Healthcare所附带的jigsaw所采用的机制为例,在现有技术 中,分析EDI文档的过程通常如下1 )正确地获得本文档来自技高网...

【技术保护点】
一种分析结构化数据(structural data)的方法,其特征在于,包括: 利用预先定义的与上述结构化数据相对应的模式信息(schemainformation),对上述结构化数据进行分析和验证; 其中,上述模式信息包括利用正 则表达式(regular expression)表示的与该结构化数据的结构和验证有关的信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:李晓凯尹宏斌
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1