基于智能文档平台的多渠道信息采集交换方法技术

技术编号:7000767 阅读:1113 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于智能文档平台的多渠道信息采集交换方法。该智能文档平台包括服务器和数据库,在服务器上部署有各种应用服务,在作为信息采集渠道的各种终端设备上安装有应用程序。应用服务与分布在终端设备上的应用程序之间调用统一的接口进行通信,该接口为与终端设备无关的API函数的接口。本发明专利技术所提供的多渠道信息采集交换方法根据不同的终端设备和采集环境,为不同的采集渠道建立起公共的数据处理中心,从而提高了信息处理和转换的能力。使用本方法进行信息采集,可以大大缩短信息采集和交换的时间,加速信息流转,减少信息采集处理的周期。

【技术实现步骤摘要】

本专利技术涉及一种信息采集交换方法,更具体地说,涉及一种基于智能文档平台的 多渠道信息采集交换方法,属于智能文档

技术介绍
目前,人们最常用的Word/Excel格式文档都属于非结构化文档,它们与结构化的 数据库是完全分开的。随着国内外电子政务建设的不断发展,普遍需要将原本分散于各环 节、不同职能部门之间异构的文档信息和内容进行有效集成。这就要求应用软件系统在处 理各种信息时,必须能够应对大量结构化和非结构化数据混杂的局面。为了解决上述的问题,人们提出了“智能文档(Smart Document) ”的技术理念。所 谓智能文档是将非结构化的文档和结构化的数据结合起来,形成一种统一的应用形式。从 技术角度来看,智能文档是一种基于XML(可扩展标记语言)的电子文档。它除了具备纸张 所有的特性外,还包含有高度结构化的XML信息、程序以及可执行的动作。这种文档在其内 容组织、表现和交互上变得更具柔性,基本上将传统的电子文档与信息系统融合了起来,既 可以处理文档内容也可以处理数据内容,完全可以替代纸质文件,做到完全意义上的“无纸 化办公”。近年来,随着互联网等技术的飞速发展,使得信息量爆炸式增长,传统纸质文档已 经无法满足信息存储的需求。另一方面,电子政务中信息采集渠道日益多样化,采集范围在 各种不确定的环境中的延伸,催生了越来越复杂的信息采集平台。大量数据的存储,数据信 息的快速分析、处理和交换成为各种信息采集平台需要首先解决的问题。然而,一般的信息 采集平台只能以某种单一的渠道获取信息,而信息的格式也通常由生产厂商自己定义,很 难与其他应用软件系统实现信息交换和共享。例如很多软件厂商采用XML格式作为智能文 档的存储格式,但仅仅在自己的系统内使用,没有提供一种使智能文档在不同应用环境中 采集信息的技术方案。在专利号为US 7609650的美国专利中,公开了一种利用数据采集文件进行的无 线终端设备数据采集方法,但是该方法需要首先制定一套标准,建立查询,通过查询生成数 据采集文件,再通过网络系统连接无线采集设备。由于终端设备是固定的,设备的选择也要 依赖查询条件,采集到的信息只能传输服务平台处理,无法再传送到其他设备。因此,该方 法无法实现针对各种环境、多渠道的信息采集交换。另外,在杨逸箫、杨明智和李永强发表在《现代计算机》2008年第7期的论文《基 于智能文档的数据交换模型研究》中,利用智能文档技术在文档内容组织、表现和交互方 面的柔性,提出以智能文档作为数据交换的统一封装载体,为解决异构系统问的集成与整 合.实现异构数据的交换与共享提供了新的方法。该论文提出利用智能文档的数据封装和 传输机制,可以根据交换数据的应用逻辑构建数据传输机制。其XML的数据表示方法解决 异构数据库间的数据映射问题,把业务数据的交换简化为XML文档的交换,实现异构系统 之间流畅的数据交换。但是,该论文中提出的智能文档结构,需要将路由信息、流程信息、文档修改记录与文档本身绑定在一起,既限制了多渠道方式采集的可能性,也破坏了数据的 单纯性、完整性。
技术实现思路
本专利技术所要解决的技术问题在于提供一种基于智能文档平台的多渠道信息采集 交换方法。利用该方法可以在统一的平台下,以标准的信息存储格式实现多渠道信息采集, 进而实现信息交换。为了实现上述的专利技术目的,本专利技术采用下述的技术方案一种,所述智能文档平台包括服务 器和数据库,在所述服务器上部署有各种应用服务,在作为信息采集渠道的各种终端设备 上安装有应用程序,其特征在于所述应用服务与分布在终端设备上的应用程序之间调用统一的接口进行通信,所 述接口为与终端设备无关的API函数的接口。其中,所述智能文档平台采用XML作为数据存储格式。终端设备将采集到的数据以XML格式传送到所述智能文档平台处理,所述智能文 档平台上存储的信息以XML格式传送到终端设备上,并以表单方式在终端设备上显示。所述智能文档包括模板和数据两部分,其中模板部分用来描述采集数据的界面, 数据部分用来存储终端设备所采集的数据。所述服务器中包括数据管理单元、数据校验单元和数据交换单元,其中数据校验 单元作为多种信息采集渠道的公共数据接口,所述数据管理单元和所述数据交换单元分别 与所述数据校验单元进行连接。当需要添加扩展操作功能时,在所述应用服务和所述应用程序的接口指令集中增 加相应的API函数,将所述API函数提供给终端设备进行调用。用户调用智能文档平台的renderForm函数输入参数,智能文档平台通过网络获 取参数后,将智能文档以表单的形式在网络浏览器中展现出来;用户填写完成后,在提交时 调用processForm函数,将数据传送给智能文档平台。所述renderForm函数和所述processForm函数中的各参数均为具体业务应用的 链接地址,与具体设备无关。本专利技术所提供的多渠道信息采集交换方法根据不同的终端设备和采集环境,为不 同的采集渠道建立起公共的数据处理中心,从而提高了信息处理和转换的能力。本方法可 以广泛地应用于各种信息采集系统。在采集方式日益繁多,数据量日益庞大,信息交换日益 迫切的情况下,使用本方法进行信息采集,可以大大缩短信息采集和交换的时间,加速信息 流转,减少信息采集处理的周期。附图说明下面结合附图和具体实施方式对本专利技术作进一步的详细说明。图1是本专利技术所提供的信息采集交换方法的整体逻辑示意图;图2为在本信息采集交换方法中,智能文档平台与终端设备之间的通信示意图;图3为在本信息采集交换方法中,在线采集流程的流程示意图4为在本信息采集交换方法中,离线采集流程的流程示意图;图5为在本信息采集交换方法中,通过PDA采集信息的流程示意图;图6为在本信息采集交换方法中,通过OCR采集信息的流程示意图;图7为在本信息采集交换方法中,通过二维条码采集信息的流程示意图。具体实施例方式本专利技术所提供的信息采集交换方法主要包括两方面的
技术实现思路
智能文档平台和 多渠道采集方式。下面分别进行详细的说明。智能文档平台是一个信息处理中心。通过多种信息采集渠道(即终端设备或采集 方式)获得的信息在智能文档平台下进行统一处理,而用以采集和展现信息的智能文档也 通过该智能文档平台分发到不同的终端设备中。该智能文档平台包括相互连接的服务器和数据库。其中,服务器用于启动应用服 务,数据库用于存储智能文档和数据。各种应用服务部署在服务器上,根据其部署在服务器 上的位置,决定服务器接口参数链接。智能文档平台可通过各种采集渠道从服务器的应用 服务中获取智能文档,同时可以通过各种渠道传送参数给应用服务的提交指令,上传数据 到服务器。同时,该智能文档平台还提供了安装在各种终端设备上的应用程序(客户端软 件),并提供相应的接口。依据信息采集环境的不同,各种终端设备只要安装了应用程序,就 能够调用相应的接口与智能文档平台建立通信,将采集到的数据以XML格式传送到智能文 档平台处理。智能文档平台上存储的信息也能够以XML格式调用相应接口连接,传送到终 端设备,并以表单方式在终端设备上显示,同时能够显示智能文档中存储的数据信息,借此 实现信息在不同终端设备之间的流转。如图1所示,智能文档平台的服务器部分包括数据管理、数据校验和数据交换三 个功能单元,其中本文档来自技高网
...

【技术保护点】
1.一种基于智能文档平台的多渠道信息采集交换方法,所述智能文档平台包括服务器和数据库,在所述服务器上部署有各种应用服务,在作为信息采集渠道的各种终端设备上安装有应用程序,其特征在于:所述应用服务与分布在终端设备上的应用程序之间调用统一的接口进行通信,所述接口为与终端设备无关的API函数的接口。

【技术特征摘要】

【专利技术属性】
技术研发人员:汪敏郑峻刘轩山王静
申请(专利权)人:北京开普互联科技有限公司广东开普互联信息科技有限公司
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1