一种自动采集固定格式数据的装置、系统及方法制造方法及图纸

技术编号:16887270 阅读:41 留言:0更新日期:2017-12-27 05:03
本发明专利技术公开了一种自动采集固定格式数据的装置、系统及方法,其中系统包括扫描终端、主服务器、企业主终端、企业分终端;扫描终端与装置通过数据接口模块连接;主服务器与装置通过网络进行连接,主服务器至少连接一个装置,主服务器用于为装置提供网络支持,接收数据扫描结果,合并扫描结果提供给企业分终端;企业主终端与主服务器连接,企业主终端用于操作人员进行扫描数据样式配置;企业分终端与主服务器通过该装置连接,企业分终端数量至少为1个,企业分终端用于操作人员根据企业主终端配置的扫描数据样式进行数据采集、编辑与上传到主服务器。本发明专利技术使用简单,对使用者要求低,使用成本低廉,采集速度快,人工复核速度快。

A device, system and method for automatic collection of fixed format data

The invention discloses a device for automatic acquisition of fixed format data system and method, wherein the system comprises a scanning terminal, the main server, the main business enterprise terminal, terminal; scan terminal connected with the device through the data interface module; and the main server device are connected by network, the main server is connected with at least one device, the master server to provide support for the network device to receive data scan results, combined with scanning result is provided to the enterprise terminal; enterprise main terminal is connected with the main server, the main terminal for enterprise operator scan data style configuration; enterprise terminal and main server connected through the device, the number of terminals of at least 1 enterprises, enterprises terminal operators for data collection, edit and upload to the main scanning data according to the enterprise main terminal configuration style The server\u3002 The invention is simple in use, low in user requirements, low in use cost, fast in collecting speed, and fast in artificial rechecking.

【技术实现步骤摘要】
一种自动采集固定格式数据的装置、系统及方法
本专利技术涉及数据采集
,具体涉及一种自动采集固定格式数据的装置、系统及方法。
技术介绍
固定格式数据,一般是指数据具有相同的固定类型模板,不同样本数据之间存在一定的重复性内容,如体检表、证书等。目前针对固定格式的数据采集主要有以下方式:第一,通过人工向信息系统中输入原始单据。缺点:速度慢,正确率难以保证;原始纸质单据无法输入到系统中,电子数据容易被篡改;数据只能在事后收集,时效性差。第二,通过带有文档识别功能的设备扫描原始单据,然后上传扫描结果和原件。缺点:设备价格昂贵;扫描准确率不高,处理速度慢;通用的扫描设备采取全文扫描的方式,不能针对结果中的有效信息进行检索;扫描结果需要人工校对准确性,工作量大,且容易出错;扫描设备本身没有数据上报接口,必须搭配人员和计算机才能实现数据采集。第三,通过人工把原始信息转录到特殊输入介质上,例如答题卡或者射频卡,然后通过专有的录入设备扫描输入介质后实现信息的电子化。缺点:设备价格昂贵,输入介质(答题卡/射频卡等)相对纸介质价格昂贵,且需要提前准备;对人员的素质要求高,系统必须由熟悉计算机系统的人员操作;使用前准备工作繁琐,使用前必须将采集对象的组织结构输入到系统;设备容错能力差,一旦系统中出现未登记的人员或者是输入数值错误系统会停止工作;操作繁琐,向介质上输入数据的速度小于手写输入速度;系统内置数据格式和输入项目更新复杂,需要专门的技术人员手动更新,可维护性差。目前,采集固定格式数据存在以下问题:现有方案所含硬件只能完成单一的数据采集功能,数据采集之后需要人工上报数据,只上报扫描结果,原始同扫描结果之间无法形成对应关系只能丢弃;现有方案用户完成数据采集后,用户需要通过电脑或者第三方工具软件对数据进行采集加工,操作繁琐;现有技术方案都是以单个点作为服务对象,没有企业联网数据采集支持。
技术实现思路
本专利技术的目的在于提供一种自动采集固定格式数据的装置、系统及方法,在采集完成后即可对外提供基于浏览器数据访问页面,用户通过电脑或者手机可以完成对数据的修改、纠错、电子表格导出等操作,同时能够对数据进行存储功能,用户无需另存数据,可以根据需要进行数据采集更新,便于数据上报与维护。为实现上述目的,本专利技术的技术方案为:一种自动采集固定格式数据的装置,所述装置包括微处理器,所述装置还包括数据接口模块、硬件控制模块、智能识别模块、数据存储模块、模板配置模块;所述数据接口模块用于所述装置连接扫描终端;所述硬件控制模块连接有所述数据接口模块,硬件控制模块用于对扫描终端进行控制,硬件控制模块通过数据接口模块获取扫描终端的扫描数据;所述智能识别模块与所述硬件控制模块连接,智能识别模块用于识别扫描终端的扫描数据;所述数据存储模块与所述硬件控制模块连接,数据存储模块与所述智能识别模块连接,数据存储模块用于储存智能识别模块的识别结果;所述模板配置模块与所述智能识别模块连接,模板配置模块用于配置智能识别模块对扫描数据的识别模板。如上所述的一种自动采集固定格式数据的装置,所述装置运行有Linux操作系统,装置内运行有主控程序,所述主控程序用于对所述硬件控制模块、智能识别模块、模板配置模块进行控制。硬件控制模块采用硬件控制器,硬件控制模块属于现有技术。智能识别模块采用基于卷积神经网络的手写识别技术,相对于基于图像识别技术的前一代手写识别技术更加精确快速。如上所述的一种自动采集固定格式数据的装置,所述数据接口模块采用USB数据接口。该装置可以通过USB数据接口连接扫描终端,进而实现装置与扫描终端之间的数据信息交互。本专利技术提供一种自动采集固定格式数据的系统,所述系统采用上述装置,所述系统还包括扫描终端、主服务器、企业主终端和企业分终端;所述扫描终端与所述装置通过数据接口模块连接;所述主服务器与所述装置通过网络进行连接,主服务器至少连接一个所述装置,主服务器用于为所述装置提供网络支持,接收数据扫描结果,合并扫描结果提供给企业分终端;所述企业主终端与所述主服务器连接,企业主终端用于操作人员进行扫描数据样式配置;所述企业分终端与所述主服务器通过所述装置连接,企业分终端数量至少为1个,企业分终端用于操作人员根据企业主终端配置的扫描数据样式进行数据采集、编辑与上传到所述主服务器。如上所述的一种自动采集固定格式数据的系统,所述扫描终端采用扫描仪,扫描终端与所述装置通过USB数据线连接。在组建自动采集固定格式数据的系统时,将扫描终端与上述装置通过USB数据线连接。如上所述的一种自动采集固定格式数据的系统,所述主服务器位于数据云中,主服务器通过云计算平台进行拓展同时为至少2个上述装置提供服务。主服务器可以通过云计算平台拓展同时为海量的采集设备提供服务。主服务器为多个本专利技术中所提到自动采集固定格式数据的装置提供网络支持,接收扫描结果,合并扫描结果提供企业用户数据支持,同时还提供远程技术支持,为数据采集公司提供数据访问接口。采集的数据可实时上报,便于远程升级维护。如上所述的一种自动采集固定格式数据的系统,所述主服务器设有移动数据接口,主服务器连接有移动终端,移动终端采用手机终端或平板电脑。企业操作人员可以通过手机终端或平板电脑进行数据访问。本专利技术还提供一种自动采集固定格式数据的方法,所述方法采用上述装置并通过上述系统,所述方法包括以下步骤:企业主终端根据数据采集需要设计对应的数据采集模板,在数据采集模板界面上配置定位码,并将数据采集模板通过服务器下发到企业分终端;企业主终端对照数据采集表格设计相应的数据识别模板,配置智能识别模块为对应的数据识别模板样式;企业分终端将按照数据采集模板采集的数据进行扫描,扫描终端通过智能识别模块对扫描的数据按照数据识别模板进行识别;将识别的扫描结果通过数据存储模块进行存储,并将扫描结果上传到服务器以供使用。如上所述的一种自动采集固定格式数据的方法,所述定位码设置在数据采集模板的界面上端,定位码的数量至少为2个,每个定位码的样式互不相同,通过所述定位码识别纸张的位移、旋转与缩放信息。定位码通过在扫描件上增加特殊标记增强数据采集设备对原始内容的定位能力,提高精确度,速度。传统的方式在页眉页脚处设置定位点,一般形式为十字交叉的直线或者是圆点等便于识别的图形,定位点之间只有位置不同,其他外观完全一致,不能提供旋转、朝向、形变等信息,本方法中每个定位码都含有唯一id,所以多个定位点(2个以上)一起可以提供整个输入数据的方向、旋转、不规则变形等更多辅助信息,对于输入资料的污损等有更好的纠错能力。现有采集方法一次只能针对一种数据格式进行采集,不能多种格式混合采集,本方法基于定位码的唯一id,可以识别出原始信息的分类,即使多种格式的原始数据一起进行数据采集,设备也可以自动分类,分别提取。现有技术方案不支持多页的原始信息录入,即使信息全部采集也无法把原始输入按照用户分成多个集合,本方法采用的唯一定位码技术,可以包含用户id,从而实现多用户多页数据的采集。如上所述的一种自动采集固定格式数据的方法,智能识别模块通过卷积神经网络识别算法对识别对象进行数据训练。卷积神经网络识别算法卷积神经网络(CNN),是近年发展起来,并引起广泛重视的一种高效识别方法。20世纪60年本文档来自技高网
...
一种自动采集固定格式数据的装置、系统及方法

【技术保护点】
一种自动采集固定格式数据的装置,所述装置包括微处理器,其特征在于:所述装置还包括数据接口模块、硬件控制模块、智能识别模块、数据存储模块、模板配置模块;所述数据接口模块用于所述装置连接扫描终端;所述硬件控制模块连接有所述数据接口模块,硬件控制模块用于对扫描终端进行控制,硬件控制模块通过数据接口模块获取扫描终端的扫描数据;所述智能识别模块与所述硬件控制模块连接,智能识别模块用于识别扫描终端的扫描数据;所述数据存储模块与所述硬件控制模块连接,数据存储模块与所述智能识别模块连接,数据存储模块用于储存智能识别模块的识别结果;所述模板配置模块与所述智能识别模块连接,模板配置模块用于配置智能识别模块对扫描数据的识别模板。

【技术特征摘要】
1.一种自动采集固定格式数据的装置,所述装置包括微处理器,其特征在于:所述装置还包括数据接口模块、硬件控制模块、智能识别模块、数据存储模块、模板配置模块;所述数据接口模块用于所述装置连接扫描终端;所述硬件控制模块连接有所述数据接口模块,硬件控制模块用于对扫描终端进行控制,硬件控制模块通过数据接口模块获取扫描终端的扫描数据;所述智能识别模块与所述硬件控制模块连接,智能识别模块用于识别扫描终端的扫描数据;所述数据存储模块与所述硬件控制模块连接,数据存储模块与所述智能识别模块连接,数据存储模块用于储存智能识别模块的识别结果;所述模板配置模块与所述智能识别模块连接,模板配置模块用于配置智能识别模块对扫描数据的识别模板。2.根据权利要求1所述的一种自动采集固定格式数据的装置,其特征在于:所述装置运行有Linux操作系统,装置内运行有主控程序,所述主控程序用于对所述硬件控制模块、智能识别模块、模板配置模块进行控制。3.根据权利要求1所述的一种自动采集固定格式数据的装置,其特征在于:所述数据接口模块采用USB数据接口。4.一种自动采集固定格式数据的系统,所述系统包括如权利要求1至3任一项所述的装置,其特征在于:所述系统还包括扫描终端、主服务器、企业主终端和企业分终端;所述扫描终端与所述装置通过数据接口模块连接;所述主服务器与所述装置通过网络进行连接,主服务器至少连接一个所述装置,主服务器用于为所述装置提供网络支持,接收数据扫描结果,合并扫描结果提供给企业分终端;所述企业主终端与所述主服务器连接,企业主终端用于操作人员进行扫描数据样式配置;所述企业分终端与所述主服务器通过所述装置连接,企业分终端数量...

【专利技术属性】
技术研发人员:李杰
申请(专利权)人:新疆圣力信息科技有限公司
类型:发明
国别省市:新疆,65

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1