解析电子表单的内容的方法及电子表单服务器技术

技术编号:4191045 阅读:427 留言:0更新日期:2012-04-11 18:40
一种在电子表单服务器上解析电子表单的内容的方法,其中电子表单被划分成多个相互独立的区域,每一个区域具有用于标识该区域的标识符,电子表单服务器包括用于缓存电子表单的已被解析的区域的解析结果的缓存器,该方法包括:获取电子表单的每个区域的内容识别码,其中,内容识别码用于标识所述区域的内容;根据每个区域的内容识别码,确定已被解析的区域和未被解析的区域;取出已被解析的区域的解析结果;对未被解析的区域的内容进行解析;用未被解析的区域的标识符、内容识别码和解析结果更新缓存器;合成已被解析的区域的解析结果和未被解析的区域的解析结果。本发明专利技术可以改善解析电子表单的内容的效率和电子表单服务器的性能,降低电子表单服务器的解析工作量。

【技术实现步骤摘要】

本专利技术涉及电子表单的处理技术,具体地,涉及在电子表单服务器上 解析电子表单的内容的方法和相应的电子表单服务器.
技术介绍
当前,电子表单在各个不同的行业中得到越来越广泛的应用,例如银 行业、保险业等。通常,当终端用户在电子表单客户机上填写了电子表单 的内容并提交后,所提交的电子表单的内容需要在电子表单服务器侧进行 解析,以构成后端其它商业服务或应用所需的输入。因此,对电子表单的 内容进行解析成为电子表单服务器的主要的工作负荷。通常,电子表单服务器在运行时直接对所提交的电子表单的全部内容 进行解析,这种解析方式对于正常大小的电子表单具有一定的效率。然而, 目前在一些行业中使用的电子表单通常都具有相当大的尺寸并且复杂,而 且有时会有多个电子表单并行地提交给电子表单服务器,如果采用上述的直接对所提交的电子表单的全部内容进行解析的方式,则电子表单服务器 将花费大量的时间和资源对电子表单的内容进行解析,从而对电子表单服 务器的性能带来4艮大的影响,甚至可能导致电子表单月i务器无法工作。另外,当在面向服务的体系架构(SOA)中集成了电子表单时,如果 采用上述的电子表单的内容的解析方式,则会给终端用户带来响应时间长、 系统性能差的感觉。下面根据IBM公司的Lotus WebForm服务器描述现有的一种解析电 子表单的内容的体系结构。该Lotus WebForm服务器在运行时可以将 XFDL格式的电子表单翻译成DHTML格式,这使终端用户可以只使用Web浏览器就能够观看、填写并提交XFDL格式的电子表单。换句话说, 终端用户无需下栽或安装浏览器插件或其它程序就能填写XFDL格式的电 子表单。例如,ACORD PCS XFDL电子表单是保险行业所使用的标准电子表 单,其尺寸非常大。ACORD XFDL电子表单被发送到上述WebForm服 务器,由WebForm服务器在终端用户请求该电子表单时,将其翻译为 DHTML格式,以4更终端用户通过Web浏览器填写。M地,当终端用户 通过Web浏览器请求某个电子表单时,WebForm服务器响应该请求,取 出所请求的XFDL电子表单,将其翻译成DHTML格式,然后呈现在Web 浏览器上供终端用户填写。当终端用户提交或者修改了所填写的电子表单 后,WebForm服务器将该电子表单再翻译成XFDL格式,然后进行相应 的处理。在这种情况下,虽然被改变的电子表单的部分仅仅占整个电子表 单的内容的大约10% ,但是WebForm服务器每次都将对电子表单的全部 内容进,译,也就是说,对于每次提交的电子表单,大约90%的相同的 电子表单的内容需要重复翻译。这大大浪费了服务器的时间和资源,因此, 当终端用户请求电子表单时将会等待很长的响应时间,有时会达到10-15 秒。综上所述,现有的直接解析电子表单的全部内容的方法对于巨大且复 杂的电子表单,解4斤效率低,并且极大地浪费电子表单服务器的时间和资 源,造成服务器性能低下。
技术实现思路
本专利技术正是基于上述技术问题而提出的,其目的在于提供一种在电子 表单服务器上解析电子表单的内容的方法和相应的电子表单服务器,能够 有效地改善电子表单的内容的解析效率,适用于尺寸大并且复杂的电子表 单。根据本专利技术的一个方面,提供一种在电子表单服务器上解析电子表单 的内容的方法,其中,所述电子表单被划分成多个相互独立的区域,并且所述多个区域的每一个具有用于标识该区域的标识符,所述电子表单服务 器包括用于緩存电子表单的已被解析的区域的解析结果的緩存器,所述方法包括获取所述电子表单的每个区域的内容识别码,其中,所述内容识 别码用于标识所述区域的内容;^L据所述每个区域的内容识别码,确定所 述电子表单中已被解析的区域和未被解析的区域;从所述緩存器中取出所 述已被解析的区域的解析结果;对所述电子表单中未被解析的区域的内容 进行解析;用所述未被解析的区域的标识符、内容识別码和解析结果更新 所述緩存器;以及合成所述已被解析的区域的解析结果和所述未被解析的 区域的解析结果,以获得所述电子表单的解析结果。根据本专利技术的另一个方面,提供一种解析电子表单的内容的电子表单 服务器,其中,所述电子表单被划分成多个相互独立的区域,并且所述多 个区域的每一个具有用于标识该区域的标识符,该电子表单服务器包括 緩存模块,用于缓存电子表单的已被解析的区域的解析结果;内容识别码 获M块,用于获取所述电子表单的每个区域的内容识别码,其中,所述 内容识别码用于标识所述区域的内容;确定模块,用于才艮据所述每个区域 的内容识别码,确定所述电子表单中已被解析的区域和未,皮解析的区域; 取出模块,用于取出所述已被解析的区域的解析结果;解析;^:,用于对 所述电子表单中未被解析的区域的内M行解析;更新模块,用于用所述 未被解析的区域的标识符、内容识别码和解析结果更新所i4^存模块;以 及合成模块,用于合成所述已被解析的区域的解析结果和所述未被解析的 区域的解析结果,以获得所述电子表单的解析结果。附图说明图l是根据本专利技术的一个实施例的在电子表单服务器上解析电子表单 的内容的方法的流程图2是电子表单的一个例子的示意图3是根据本专利技术的一个实施例的解析电子表单的内容的电子表单服 务器的示意性方框图;图4是緩存模块的示意性方框图。 具体实施例方式相信通过以下结合附闺对本专利技术的具体实施例的详细描述,本专利技术的 上述和其它目的、特征和优点将变得更加明显。图1是根据本专利技术的一个实施例的在电子表单服务器上解析电子表单 的内容的方法的流程图。下面结合附图,对本实施例进行详细的描述。本实施例的在电子表单服务器上解析电子表单的内容的方法是基于以 下的事实在大多数情况下,所提交的电子表单有许多内容是相同的,例 如前述的ACORD XFDL电子表单.由于现有的解析电子表单的方法需要 对电子表单的全部内^ii行解析,因此,这些相同的内容将被重复地解析, 这造成电子表单服务器的重复工作。如图1所示,在设计阶段,电子表单被划分成多个相互独立的区域(步 骤S101),即相对于后面的内容解析,这多个区域彼此之间没有从属或引 用的关系。另外,每个区域具有唯一的用于标识该区域的标识符,该标识 符可以是自动生成的,也可以是自定义的,例如,标识符可以由电子表单 的名称加上各自的区域编号构成,如eForm l-Section 1。图2示出了电子表单的一个例子的示意图。本领域的普通技术人员已 知电子表单有IBM公司提供的Lotus Forms电子表单、Adobe公司提供的 PDF电子表单、基于Web的电子表单等。图2所示的电子表单被划分成4 个区域,分别是eForm l-Section 1、 eForm l-Section 2、 eForm l-Section 3 和eForml-Section4,这4个区域的内斜目互独立。在后面所描述的内容 解析中,这4个区域的内容能够被分别地解析。当电子表单在电子表单客户机端被填写并提交给电子表单服务器后, 在步骤S105,获取电子表单的每个区域的内容识别码,该内容识别码用于 标识各个区域的内容。具体地,在一个实施例中,首先,查看所提交的电子表单中是否包含 该电子表单的每个区域的内容识别码。如果包含,即每个区域的内容识别码是本文档来自技高网
...

【技术保护点】
一种在电子表单服务器上解析电子表单的内容的方法,其中,所述电子表单被划分成多个相互独立的区域,并且所述多个区域的每一个具有用于标识该区域的标识符,所述电子表单服务器包括用于缓存电子表单的已被解析的区域的解析结果的缓存器,所述方法包括:   获取所述电子表单的每个区域的内容识别码,其中,所述内容识别码用于标识所述区域的内容; 根据所述每个区域的内容识别码,确定所述电子表单中已被解析的区域和未被解析的区域; 从所述缓存器中取出所述已被解析的区域的解析结果; 对 所述电子表单中未被解析的区域的内容进行解析; 用所述未被解析的区域的标识符、内容识别码和解析结果更新所述缓存器;以及 合成所述已被解析的区域的解析结果和所述未被解析的区域的解析结果,以获得所述电子表单的解析结果。

【技术特征摘要】
1.一种在电子表单服务器上解析电子表单的内容的方法,其中,所述电子表单被划分成多个相互独立的区域,并且所述多个区域的每一个具有用于标识该区域的标识符,所述电子表单服务器包括用于缓存电子表单的已被解析的区域的解析结果的缓存器,所述方法包括获取所述电子表单的每个区域的内容识别码,其中,所述内容识别码用于标识所述区域的内容;根据所述每个区域的内容识别码,确定所述电子表单中已被解析的区域和未被解析的区域;从所述缓存器中取出所述已被解析的区域的解析结果;对所述电子表单中未被解析的区域的内容进行解析;用所述未被解析的区域的标识符、内容识别码和解析结果更新所述缓存器;以及合成所述已被解析的区域的解析结果和所述未被解析的区域的解析结果,以获得所述电子表单的解析结果。2. 根据权利要求1所述的在电子表单服务器上解析电子表单的内容 的方法,其中,所述获取所述电子表单的每个区域的内容识别码的步骤包 括查看所述电子表单中是否包含所述每个区域的内容识别码; 如果包含,则从所述电子表单中提取每个区域的内容识别码; 如果不包含,则基于所述电子表单的每个区域的内容,生成每个区域 的内容识别码。3. 根据权利要求1或2所述的在电子表单服务器上解析电子表单的 内容的方法,其中,所述确定所述电子表单中已被解析的区域的步骤包括:对于所述电子表单中的每个区域,在所述緩存器中查找是否存在与该 区域的内容识别码对应的内容识别码;如果存在,则确定具有该内容识别码的区域是已被解析的区域;以及如果不存在,则确定具有该内容识别码的区J^未^jSf析的区域。4. 根据权利要求3所述的在电子表单服务器上解析电子表单的内容 的方法,其中,所述确定所述电子表单中已被解析的区域的步骤还包括对于所确定的未被解析的区域,在緩存器中查找所述未被解析的区域 的标识符;如果查找到所述未被解析的区域的标识符,则清除该区域的标识符所 对应的内容识别码和解析结果。5. 根据权利要求1至4任意一项所述的在电子表单服务器上解析电 子表单的内容的方法,其中,所述^存器对每个电子表单提供单独的緩存 区,每个緩存区包括多个緩存子区,其分别与所述电子表单的多个区域 相对应,并緩存该区域的标识符、内容识别码及其解析结果;所述取出所述已被解析的区域的解析结果的步骤包括 根据所述已被解析的区域的标识符,在所i^存器中查找对应的緩存 子区;以及根据所述已被解析的区域的内容识别码,确定对应的解析结果。6. 根据权利要求1至5任意一项所述的在电子表单服务器上解析电 子表单的内容的方法,其中,所述解析步骤包括将所述内容翻译成所需 的格式。7. 根据权利要求1至6任意一项所述的在电子表单服务器上解析电 子表单的内容的方法,其中,所述内容识别码是哈希代码,8. —种解析电子表单的内容的电子表单服务器,其中,所述电子表 单被划分成多个相互独立的区域,并且所述多个区域的每一个具有用于标 识该区域的标识符,该电子表单服...

【专利技术属性】
技术研发人员:王强李珉郭迎春魏利王小锋周志远赵晓锋
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1