一种在线图文转换方法技术

技术编号:20160691 阅读:105 留言:0更新日期:2019-01-19 00:13
本发明专利技术公开了一种在线图文转换方法,包括:接收用户发送的图文转换请求;将待转换文档划分为若干待转换子文档;向转换账户、审核账户和格式调整账户派发任务;转换账户对待转换子文档进行格式转换,得到对应的已转换子文档,将已转换格式的待转换子文档的转换状态标记为已转换;审核账户对待转换子文档的转换状态进行监控,在任一待转换子文档的转换状态为已转换时,获取对应的已转换子文档进行审核;审核通过后,将所有已转换子文档进行合并,得到准转换文档;对准转换文档进行格式调整,得到已转换文档;将已转换文档反馈给用户。本设计可使人工转换的耗时成倍地缩减,有效保证人工转换的准确性和定制性。

【技术实现步骤摘要】
一种在线图文转换方法
本专利技术涉及图文转换辅助领域,尤其是一种在线图文转换方法。
技术介绍
随着当代企业管理信息化进程的不断深入,越来越多的企业或机构有了将纸质文档电子化的需求。将纸质资料扫描为图片,再对图片进行文字识别,最终转换为易于编辑的文档格式(如Word,Excel等Office文档),可以为后续的数据处理(如翻译、检索、归档等)提供基础。对于部分传统、老牌企业来说,由于它们有着多年的文档累积,需要电子化的文档是海量的。不仅如此,文档电子化需求也在逐步渗透到越来越多的领域,如辅助教学,智能阅卷等等。对于纸质文档的电子存储形式通常以pdf格式存储,其扫描速度快、体积小,但难以进行文档内容的编辑、查询,所以还需要进一步将pdf文件转换为word、excel等易于编辑的Office文档。将pdf、jpg等格式的文件转换为易于编辑的文档格式(通常为Office文档,如Word、Excel等)的过程如果利用现有的计算机自动化进行文字识别的技术,其效率虽然高,但目前还不成熟,错误率高。目前主要还是依靠人工转换,对于图文转换企业,一般也是交由某个员工负责。据统计,一个工作人员将一个800页的pdf文件人工进行格式转换和排版至少需要花费3到4天时间,再加上任务交接、文档审核、校正的时间,总耗时甚至可能接近一周。而企业级的文档量通常在万页级,这样数量级的文档电子化耗时是按月算的,效率极其低下。同时,目前校验审核一般都是负责转换的人员自己进行审核,一方面容易出现漏检,另一方面也对审核缺乏监督机制,对图文转换过程缺乏系统性的管理。以上仅为对图文进行转换环节存在的问题。除此之外,客户往往并不仅限于将文档转换为可编辑文字,其需要直接将转换的文档加以使用。而目前市场的产品几乎都仅限于将文档转换成对应可编辑文字,而没有实现文档进一步定制,例如对文件格式进行调整。这就导致客户需要对文字进行再加工才能得到最终所需要的文档,这就造成客户除了付出金钱外,还要付出额外劳动力,严重影响用户体验。
技术实现思路
本专利技术的专利技术目的在于:针对上述存在的全部或部分问题,提供一种在线图文转换方法,以解决现有人工转换图文效率低、流程长的问题。本专利技术采用的技术方案如下:一种在线图文转换方法,包括以下步骤:S1:接收用户发送的图文转换请求,该图文转换请求中携带有待转换格式的待转换文档和转换条件;S2:根据待转换文档的文档信息,将待转换文档划分为若干待转换子文档;S3:对于每一个待转换文档,按预定规则挑选出至少一个转换账户、至少一个审核账户和一个格式调整账户,根据划分的若干待转换子文档,分别向挑选出的转换账户、审核账户和格式调整账户派发任务;S4:每一个转换账户对派发的转换任务中的每一个待转换子文档进行格式转换,得到对应的已转换子文档,并将已转换格式的待转换子文档的转换状态标记为已转换;S5:每一个审核账户对派发的审核任务中的每一个待转换子文档的转换状态进行监控,在任一待转换子文档的转换状态为已转换时,获取对应的已转换子文档按预定规则进行审核;S6:在所有待转换子文档所对应的已转换子文档审核通过时,将所有已转换子文档进行合并,得到准转换文档,标记所述待转换文档的审核状态为已审核;S7:格式调整账户对派发的格式调整任务中的待转换文档的审核状态进行监控,在审核状态为已审核时,获取对应的准转换文档,根据所述转换条件,对准转换文档进行格式调整,得到已转换文档;S8:将已转换文档反馈给用户。综上所述,由于采用了上述技术方案,本专利技术的有益效果是:1、通过对文档的智能拆分和任务派发,可使人工转换的耗时成倍地缩减,同时结合转换审核和格式调整环节,可有效保证人工转换的准确性和定制性。2、基于任务的自动派发能力,可保证每一份拆分文档的转换时间趋于相等,进而在整体上保证文档转换的时效性。3、基于任务到达消息的提醒,可便于相关账户主体对任务的及时处理,以保证整体任务完成的时效性。4、本设计的方法可快速对文档进行定价,可大幅缩减人工定价的工作量,同时有效减少人工协商价格的流程和纠纷。附图说明本专利技术将通过例子并参照附图的方式说明,其中:图1是图文转换方法流程图。图2是图文转换方法执行的一个实施例。具体实施方式本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。本说明书(包括任何附加权利要求、摘要)中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。如图1所示,本实施例公开了一种在线图文转换方法,该方法可将难以处理的扫描件、图片等转换文便于编辑的电子文档,该方法包括以下步骤:S1:接收用户发送的图文转换请求,该图文转换请求中携带有待转换格式的待转换文档和转换条件。在一个实施例中,对于转换条件,除了包括对最终转换出的电子文档的格式要求外,还包括对图文转换的时限要求,如是否加急。S2:根据待转换文档的文档信息,将待转换文档划分为若干待转换子文档。此处的划分,优选根据待转换文档的工作量进行平均划分。对于文档信息,包括文档的格式(如PDF、图片)、页数、每页文本量、格式复杂度、图片清晰度等。S3:对于每一个待转换文档,按预定规则挑选出至少一个转换账户、至少一个审核账户和一个格式调整账户,根据划分的若干待转换子文档,分别向挑选出的转换账户、审核账户和格式调整账户派发任务。优选的,在向转换账户派发任务前,还将所拆分的待转换子文档进行预处理。此处预处理例如对比度调整、锐化、图像增强等,以提高文档的显示效果,便于格式转换人员的识别和处理。S4:每一个转换账户对派发的转换任务中的每一个待转换子文档进行格式转换,得到对应的已转换子文档,并将已转换格式的待转换子文档的转换状态标记为已转换。显然,对于每一个待转换子文档,均会有一个对应的已转换子文档。对于转换账户而言,其可以借助现有图文转换工具(如OCR)进行预转换,该图文转换工具优选集成到转换账户的操作界面,或者将图文转换工具的API接口集成到转换账户的操作界面中由图文转换人员调用(如网页插件),再对预转换的文档进行校验修正,得到已转换子文档;当然,也可以通过全人工的方式进行格式转换转换账户可以在线对待转换子文档进行转换,也可以下载待转换子文档进行离线转换,然后将已转换子文档上传。S5:每一个审核账户对派发的审核任务中的每一个待转换子文档的转换状态进行监控,在任一待转换子文档的转换状态为已转换时,获取对应的已转换子文档按预定规则进行审核。上述的预定规则为:审核人员(登录审核账户的员工)借助平台对待转换子文档进行在线审核,即将拆分的待转换子文档和对应的已转换子文档进行对照审核。为保证上下文审核的关联性,例如段落间的衔接,进而提高文档整体的可视化效果,优选将一个待转换文档的所有拆分部分(即待转换子文档)派发给一个审核账户进行审核。S6:在所有待转换子文档所对应的已转换子文档审核通过时,将所有已转换子文档进行合并,得到准转换文档,标记所述待转换文档的审核状态为已审核。上述对已转换文档的合并,为以对应待转换子文档在待转换文档中的位置关系进行合并。对已转换子文档的合并,在一个实施例中,为通过API接口本文档来自技高网
...

【技术保护点】
1.一种在线图文转换方法,其特征在于,包括以下步骤:S1:接收用户发送的图文转换请求,该图文转换请求中携带有待转换格式的待转换文档和转换条件;S2:根据待转换文档的文档信息,将待转换文档划分为若干待转换子文档;S3:对于每一个待转换文档,按预定规则挑选出至少一个转换账户、至少一个审核账户和一个格式调整账户,根据划分的若干待转换子文档,分别向挑选出的转换账户、审核账户和格式调整账户派发任务;S4:每一个转换账户对派发的转换任务中的每一个待转换子文档进行格式转换,得到对应的已转换子文档,并将已转换格式的待转换子文档的转换状态标记为已转换;S5:每一个审核账户对派发的审核任务中的每一个待转换子文档的转换状态进行监控,在任一待转换子文档的转换状态为已转换时,获取对应的已转换子文档按预定规则进行审核;S6:在所有待转换子文档所对应的已转换子文档审核通过时,将所有已转换子文档进行合并,得到准转换文档,标记所述待转换文档的审核状态为已审核;S7:格式调整账户对派发的格式调整任务中的待转换文档的审核状态进行监控,在审核状态为已审核时,获取对应的准转换文档,根据所述转换条件,对准转换文档进行格式调整,得到已转换文档;S8:将已转换文档反馈给用户。...

【技术特征摘要】
1.一种在线图文转换方法,其特征在于,包括以下步骤:S1:接收用户发送的图文转换请求,该图文转换请求中携带有待转换格式的待转换文档和转换条件;S2:根据待转换文档的文档信息,将待转换文档划分为若干待转换子文档;S3:对于每一个待转换文档,按预定规则挑选出至少一个转换账户、至少一个审核账户和一个格式调整账户,根据划分的若干待转换子文档,分别向挑选出的转换账户、审核账户和格式调整账户派发任务;S4:每一个转换账户对派发的转换任务中的每一个待转换子文档进行格式转换,得到对应的已转换子文档,并将已转换格式的待转换子文档的转换状态标记为已转换;S5:每一个审核账户对派发的审核任务中的每一个待转换子文档的转换状态进行监控,在任一待转换子文档的转换状态为已转换时,获取对应的已转换子文档按预定规则进行审核;S6:在所有待转换子文档所对应的已转换子文档审核通过时,将所有已转换子文档进行合并,得到准转换文档,标记所述待转换文档的审核状态为已审核;S7:格式调整账户对派发的格式调整任务中的待转换文档的审核状态进行监控,在审核状态为已审核时,获取对应的准转换文档,根据所述转换条件,对准转换文档进行格式调整,得到已转换文档;S8:将已转换文档反馈给用户。2.如权利要求1所述的图文转换方法,其特征在于,所述S5具体为:S51:每一个审核账户对派发的审核任务中的每一个待转换子文档的转换状态进行监控,在任一待转换子文档的转换状态为已转换时,执行S52;S52:获取转换状态为已转换的待转换子文档所对应的已转换子文档,根据预定规则对获取的已转换子文档进行审核;S53:将审核通过的已转换子文档标记为审核通过状态,将审核不通过的已转换子文档标记为审核不通过状态;若存在审核不通过的已转换文档,则执行S54,否则,执行S6;S54:向处理审核不通过的已转换子文档的转换账...

【专利技术属性】
技术研发人员:马万炯陈俊周杨琴杨龙杰左林翼
申请(专利权)人:四川译讯信息科技有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1