【技术实现步骤摘要】
本专利技术涉及数据处理领域,具体地,涉及分析结构化数据(structural data)的方法和装置、转换结构化数据的方法和装置以及拆分结构化数据 的方法和装置。
技术介绍
电子数据交换(Electronic Data Interchange, EDI)是这样一组标准 其用于构建要在商务、组织、政府实体和其他团体之间以及内部进行电子 交换的信息。作为数据交换的标准手段,对于EDI来说,最重要的任务是 分析根据EDI标准所构建的EDI文档,以使业务合作伙伴能够从中获得所 感兴趣的有用信息。但是,很遗憾,如本领域技术人员所公知的,EDI文 档是一种可读性很差的基于文本的文档。与XML文档相比较,EDI文档 并不具有自描述信息。这导致在现有技术中、在对EDI文档进行分析时, 首先要根据预定的分隔符信息等获取EDI文档的结构知识,然后才能够在 该结构知识的基础上对EDI文档的具体内容进行分析。因而,在现有技术 中,缺乏一种用于分析EDI文档的、标准且灵活的机制。以WBSF Healthcare所附带的jigsaw所采用的机制为例,在现有技术 中,分析EDI文档的过程通常 ...
【技术保护点】
一种分析结构化数据(structural data)的方法,其特征在于,包括: 利用预先定义的与上述结构化数据相对应的模式信息(schemainformation),对上述结构化数据进行分析和验证; 其中,上述模式信息包括利用正 则表达式(regular expression)表示的与该结构化数据的结构和验证有关的信息。
【技术特征摘要】
【专利技术属性】
技术研发人员:李晓凯,尹宏斌,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。