The invention provides a system for image to text conversion, including a client and a receiver, including the following steps: Step 1: the receiver is used to receive the image to text conversion request sent by the client, and the image to text conversion request carries the document to be converted, the conversion condition and the operating system information of the format to be converted; step 2: the receiver classifies the document to be converted according to the operating system information Step 3: the receiving end divides the document to be converted into several sub documents to be converted according to the conversion conditions; step 4: the receiving end converts each sub document to be converted; step 5: the receiving end audits each converted sub document; step 6: the receiving end merges the qualified sub documents in step 5 to form a new document; step 7: The receiver transmits the new document to the client; step 8: complete the conversion. The operation system information of the customer is confirmed in advance, there is no error during conversion, and the customer experience is good.
【技术实现步骤摘要】
一种在线图文转换方法
本专利技术涉及智能网关设备领域,尤其涉及一种在线图文转换方法。
技术介绍
随着当代企业管理信息化进程的不断深入,越来越多的企业或机构有了将纸质文档电子化的需求。将纸质资料扫描为图片,再对图片进行文字识别,最终转换为易于编辑的文档格式(如Word,Excel等Office文档),可以为后续的数据处理(如翻译、检索、归档等)提供基础。对于部分传统、老牌企业来说,由于它们有着多年的文档累积,需要电子化的文档是海量的。不仅如此,文档电子化需求也在逐步渗透到越来越多的领域,如辅助教学,智能阅卷等等。对于纸质文档的电子存储形式通常以pdf格式存储,其扫描速度快、体积小,但难以进行文档内容的编辑、查询,所以还需要进一步将pdf文件转换为word、excel等易于编辑的Office文档。将pdf、jpg等格式的文件转换为易于编辑的文档格式(通常为Office文档,如Word、Excel等)的过程如果利用现有的计算机自动化进行文字识别的技术,其效率虽然高,但目前还不成熟,错误率高。目前主要还是依靠人工转换,对于图文转换企业,一般也是交由某个员工负责。据统计,一个工作人员将一个800页的pdf文件人工进行格式转换和排版至少需要花费3到4天时间,再加上任务交接、文档审核、校正的时间,总耗时甚至可能接近一周。而企业级的文档量通常在万页级,这样数量级的文档电子化耗时是按月算的,效率极其低下。同时,目前校验审核一般都是负责转换的人员自己进行审核,一方面容易出现漏检,另一方面也对审核缺乏监督机制,对图文转换过 ...
【技术保护点】
1.一种在线图文转换方法,包括用户端和接收端,其特征在于,包括以下步骤:/n步骤1:所述接收端用于接收所述用户端发送的图文转换请求,所述图文转换请求中携带有待转换格式的待转换文档、转换条件和操作系统信息;/n步骤2:所述接收端根据所述操作系统信息将待转换文档归类到对应待转区域的文件文档中;/n步骤3:所述接收端根据所述转换条件将所述待转换文档划分为若干个待转换子文档;/n步骤4:所述接收端对每个待转换子文档进行转换;/n步骤5:所述接收端对每个转换后的子文档进行审核;/n步骤6:当所述步骤5中所有的转换后的子文档均审核合格后,所述接收端合并步骤5中审核合格的子文档,形成新文档;/n步骤7:所述接收端将所述新文档传输给所述用户端;/n步骤8:完成转换。/n
【技术特征摘要】
1.一种在线图文转换方法,包括用户端和接收端,其特征在于,包括以下步骤:
步骤1:所述接收端用于接收所述用户端发送的图文转换请求,所述图文转换请求中携带有待转换格式的待转换文档、转换条件和操作系统信息;
步骤2:所述接收端根据所述操作系统信息将待转换文档归类到对应待转区域的文件文档中;
步骤3:所述接收端根据所述转换条件将所述待转换文档划分为若干个待转换子文档;
步骤4:所述接收端对每个待转换子文档进行转换;
步骤5:所述接收端对每个转换后的子文档进行审核;
步骤6:当所述步骤5中所有的转换后的子文档均审核合格后,所述接收端合并步骤5中审核合格的子文档,形成新文档;
步骤7:所述接收端将所述新文档传输给所述用户端;
步骤8:完成转换。
2.根据权利要求1所述的一种在线图文转换方法,其特征在于,所述步骤1中,所述接收端接收图文转换请求之前,所述接收端先要对用户端进行确认,确认该用户端是被允许使用的用户端。
3.根据权利要求1所述的一种在线图文转换方法,其特征在于,所述操作系统信息由系统的用户端自动检测。
<...
【专利技术属性】
技术研发人员:林永松,
申请(专利权)人:安徽永顺信息科技有限公司,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。