合同内容校阅装置制造方法及图纸

技术编号:15878645 阅读:34 留言:0更新日期:2017-07-25 16:38
本发明专利技术提供了一种合同内容校阅装置,以发送给客户的电子版原始合同作为标准文档对客户寄回的纸质合同经扫描得到的待校阅文档进行内容校阅,包括:当前页设定部、当前页获取部、当前标准行设定部、当前标准行抽取部、一致性判断部、标记赋予控制部、末行判断部、未标记判断部、末页判断部以及文档输出部。本发明专利技术的合同内容校阅装置能够对标准文档和待校阅文档进行逐行校阅,即使OCR装置在某行出现误识别,也不会对其他行的校阅产生影响,其校阅错误率大大降低,从而能够真正减少校阅人员的工作量。

The contents of the contract review device

The invention provides a device to review the contents of the contract, sent to the customer the electronic version of the original contract as the standard document to customers to send back the paper contract by scanning the document to review the content review, including: the current page set, the current page, the current standard for acquiring setting unit, the current standard for extraction department, consistency of judgment, mark given control department, line judge, judge, judge the unlabeled back part and output part of the document. The contents of the contract including the device of the invention can be found on line standard documents and to review the document, even if the OCR device in a row of error identification, also will not have an impact on other lines of review, the review error rate is greatly reduced, which can really reduce the workload.

【技术实现步骤摘要】
合同内容校阅装置
本专利技术属于文档处理
,涉及一种合同内容校阅装置。
技术介绍
银行、保险公司等机构需要经常与客户签订合同。为了方便外地客户签订,常见的做法是通过网络将合同电子版发送给客户,让客户自行打印签字后寄回。在收到客户寄回的纸质合同时,发出合同的机构需要安排人员校阅纸质合同的内容是否和发送给客户的电子文档一致,确认客户未对合同内容进行篡改后才能够进行归档处理。合同的页数通常很多,内容也较为复杂,因此人工校阅的工作量非常大。为了减少校阅人员的工作量,现有技术中出现了一些对原始合同和纸质合同进行机器校阅的设备。例如,利用光学字符识别(以下简称为OCR)装置对纸质合同的扫描文档进行文字识别得到相应的电子文档,然后将该电子文档和原始合同的电子文档进行比对,并将其中的差异处标出以便校阅人员复查。但是,上述机器校阅设备所采用的比对方式均为逐字比对或逐句比对,一旦OCR装置发生误识别(例如空格数量误识别、漏字、漏行等),该误识别处后方的文字位置及排布就会受到影响,使得校阅设备产生误判。因此,这样的设备错误率较高,使得复查的工作量仍然较大,难以减少校阅人员工作量的目的。
技术实现思路
为解决上述问题,提供一种错误率较低,能够减少校阅人员工作量的合同内容校阅装置,本专利技术采用了如下技术方案。本专利技术提供了一种合同内容校阅装置,以发送给客户的电子版原始合同作为标准文档对客户寄回的纸质合同经扫描得到的待校阅文档进行内容校阅,其特征在于,包括:当前页设定部、当前页获取部、当前标准行设定部、当前标准行抽取部、一致性判断部、标记赋予控制部、末行判断部、未标记判断部、末页判断部以及文档输出部,其中,当前页设定部设定标准文档中的预定页面为当前标准页,并设定待校阅文档中与该预定页面的页码相同的页面为当前待校阅页,当前页获取部分别从标准文档以及待校阅文档中获取当前标准页以及当前待校阅页,当前标准行设定部将当前标准页中的文字行按照行号顺序分别依次设定为当前标准行,当前标准行抽取部从标准文档中将当前标准行抽出,一致性判断部依据行号顺序将当前待校阅页中的文字行逐行设定为待校阅行,并根据预定判断规则对该待校阅行进行一致性判断处理用于判断该待校阅行是否与当前标准行一致,一旦存在一致的待校阅行时,标记赋予控制部对当前标准行以及一致的待校阅行分别赋予一致性标记,并控制当前标准行设定部设定下一行为当前标准行,当不存在一致的待校阅行时,标记赋予控制部对当前标准行赋予不存在标记,并控制当前标准行设定部设定下一行为当前标准行,末行判断部判断当前标准行是否为当前标准页中的最后一行,当判断为最后一行时,未标记判断部判断当前待校阅页中是否存在未标记的待校阅行,当判断为不存在未标记的待校阅行时,末页判断部判断当前标准页是否为标准文档中的末页,当判断为不是末页时,当前页设定部设定标准文档中的下一页为当前标准页,并设定待校阅文档中的下一页为当前待校阅页,当判断为末页时,文档输出部对标准文档及待校阅文档连同标记一起进行输出。专利技术作用与效果根据本专利技术提供的合同内容校阅装置,由于一致性判断部能够根据预定判断规则判断当前待校阅页中是否存在与当前标准行一致的文字行,标记赋予控制部能够在存在一致的文字行时分别对当前标准行和待校阅行赋予一致性标记,在不存在时对当前标准行赋予不存在标记,因此本专利技术的合同内容校阅装置能够对标准文档和待校阅文档进行逐行校阅,即使OCR装置在某行出现误识别,也不会对其他行的校阅产生影响,其校阅错误率大大降低,从而能够真正减少校阅人员的工作量。附图说明图1是本专利技术实施例的合同内容校阅装置的框图;图2是本专利技术实施例的文档预处理部的框图;图3是本专利技术实施例的合同内容校阅装置的工作流程图。图4是本专利技术实施例的文档预处理部的预处理流程图。具体实施方式以下结合附图来说明本专利技术的具体实施方式。作为一种实施形态,本专利技术提供了一种合同内容校阅装置,以发送给客户的电子版原始合同作为标准文档对客户寄回的纸质合同经扫描得到的待校阅文档进行内容校阅,其特征在于,包括:当前页设定部、当前页获取部、当前标准行设定部、当前标准行抽取部、一致性判断部、标记赋予控制部、末行判断部、未标记判断部、末页判断部以及文档输出部,其中,当前页设定部设定标准文档中的预定页面为当前标准页,并设定待校阅文档中与该预定页面的页码相同的页面为当前待校阅页,当前页获取部分别从标准文档以及待校阅文档中获取当前标准页以及当前待校阅页,当前标准行设定部将当前标准页中的文字行按照行号顺序分别依次设定为当前标准行,当前标准行抽取部从标准文档中将当前标准行抽出,一致性判断部依据行号顺序将当前待校阅页中的文字行逐行设定为待校阅行,并根据预定判断规则对该待校阅行进行一致性判断处理用于判断该待校阅行是否与当前标准行一致,一旦存在一致的待校阅行时,标记赋予控制部对当前标准行以及一致的待校阅行分别赋予一致性标记,并控制当前标准行设定部设定下一行为当前标准行,当不存在一致的待校阅行时,标记赋予控制部对当前标准行赋予不存在标记,并控制当前标准行设定部设定下一行为当前标准行,末行判断部判断当前标准行是否为当前标准页中的最后一行,当判断为最后一行时,未标记判断部判断当前待校阅页中是否存在未标记的待校阅行,当判断为不存在未标记的待校阅行时,末页判断部判断当前标准页是否为标准文档中的末页,当判断为不是末页时,当前页设定部设定标准文档中的下一页为当前标准页,并设定待校阅文档中的下一页为当前待校阅页,当判断为末页时,文档输出部对标准文档及待校阅文档连同标记一起进行输出。在该实施形态中,还可以具有这样的特征,还包括待确认含量计算部以及警告部,其中,当未标记判断部判断为存在未标记的待校阅行时,标记赋予控制部对未标记的待校阅行赋予待确认标记,并控制待确认含量计算部计算待确认标记的行数在整个待校阅页中的含量,当该含量大于等于预定含量值时,进一步控制警告部发出警告提示告知校阅人员该纸件合同不符合要求,当该含量小于预定含量值时,控制末页判断部进行判断处理。在该实施形态中,还可以具有这样的特征,其中,预定判断规则为:当待校阅行与当前标准行的字符内容完全相同时,该待校阅行及当前标准行一致。在该实施形态中,还可以具有这样的特征,其中,预定判断规则为:当待校阅行与当前标准行的字符内容完全相同并且待校阅行与当前标准行前后预定数量的文字行内容的差异度小于等于预定差异度时,待校阅行与当前标准行一致。在该实施形态中,还可以具有这样的特征,还包括:文档预处理部,对标准文档及待校阅文档进行预处理并将预处理后的标准文档及待校阅文档提供给当前页获取部,具有:空格识别计数单元,对文字行中的空格进行识别并对该空格所持续的字符进行计数;空格合并单元,将持续字符超过三个的空格替换为持续字符为一个的空格;空格删除单元,将持续字符两个以下的空格删除。在该实施形态中,还可以具有这样的特征,其中,文档预处理部还包括标点符号统一单元,用于将标准文档及待校阅文档中的全部标点符号统一为全角格式或半角格式。<实施例>图1是本专利技术实施例的合同内容校阅装置的框图。如图1所示,合同内容校阅装置100包括当前页设定部1、当前页获取部2、当前标准行设定部3、当前标准行抽取部4、一致性判断部5本文档来自技高网...
合同内容校阅装置

【技术保护点】
一种合同内容校阅装置,以发送给客户的电子版原始合同作为标准文档对客户寄回的纸质合同经扫描得到的待校阅文档进行内容校阅,其特征在于,包括:当前页设定部、当前页获取部、当前标准行设定部、当前标准行抽取部、一致性判断部、标记赋予控制部、末行判断部、未标记判断部、末页判断部以及文档输出部,其中,所述当前页设定部设定所述标准文档中的预定页面为当前标准页,并设定所述待校阅文档中与该预定页面的页码相同的页面为当前待校阅页,所述当前页获取部分别从所述标准文档以及所述待校阅文档中获取所述当前标准页以及所述当前待校阅页,所述当前标准行设定部将所述当前标准页中的文字行按照行号顺序分别依次设定为当前标准行,所述当前标准行抽取部从所述标准文档中将所述当前标准行抽出,所述一致性判断部依据行号顺序将所述当前待校阅页中的文字行逐行设定为待校阅行,并根据预定判断规则对该待校阅行进行一致性判断处理用于判断该待校阅行是否与所述当前标准行一致,一旦存在一致的所述待校阅行时,所述标记赋予控制部对所述当前标准行以及一致的待校阅行分别赋予一致性标记,并控制所述当前标准行设定部设定下一行为所述当前标准行,当不存在一致的所述待校阅行时,所述标记赋予控制部对所述当前标准行赋予不存在标记,并控制所述当前标准行设定部设定下一行为所述当前标准行,所述末行判断部判断所述当前标准行是否为所述当前标准页中的最后一行,当判断为最后一行时,所述未标记判断部判断所述当前待校阅页中是否存在未标记的待校阅行,当判断为不存在未标记的待校阅行时,所述末页判断部判断所述当前标准页是否为所述标准文档中的末页,当判断为不是末页时,所述当前页设定部设定所述标准文档中的下一页为当前标准页,并设定所述待校阅文档中的下一页为当前待校阅页,当判断为末页时,所述文档输出部对所述标准文档及所述待校阅文档连同标记一起进行输出。...

【技术特征摘要】
1.一种合同内容校阅装置,以发送给客户的电子版原始合同作为标准文档对客户寄回的纸质合同经扫描得到的待校阅文档进行内容校阅,其特征在于,包括:当前页设定部、当前页获取部、当前标准行设定部、当前标准行抽取部、一致性判断部、标记赋予控制部、末行判断部、未标记判断部、末页判断部以及文档输出部,其中,所述当前页设定部设定所述标准文档中的预定页面为当前标准页,并设定所述待校阅文档中与该预定页面的页码相同的页面为当前待校阅页,所述当前页获取部分别从所述标准文档以及所述待校阅文档中获取所述当前标准页以及所述当前待校阅页,所述当前标准行设定部将所述当前标准页中的文字行按照行号顺序分别依次设定为当前标准行,所述当前标准行抽取部从所述标准文档中将所述当前标准行抽出,所述一致性判断部依据行号顺序将所述当前待校阅页中的文字行逐行设定为待校阅行,并根据预定判断规则对该待校阅行进行一致性判断处理用于判断该待校阅行是否与所述当前标准行一致,一旦存在一致的所述待校阅行时,所述标记赋予控制部对所述当前标准行以及一致的待校阅行分别赋予一致性标记,并控制所述当前标准行设定部设定下一行为所述当前标准行,当不存在一致的所述待校阅行时,所述标记赋予控制部对所述当前标准行赋予不存在标记,并控制所述当前标准行设定部设定下一行为所述当前标准行,所述末行判断部判断所述当前标准行是否为所述当前标准页中的最后一行,当判断为最后一行时,所述未标记判断部判断所述当前待校阅页中是否存在未标记的待校阅行,当判断为不存在未标记的待校阅行时,所述末页判断部判断所述当前标准页是否为所述标准文档中的末页,当判断为不是末页时,所述当前页设定部设定所述标准文档中的下一页为当前标准页,并设定所述待校阅文档中的下一页为当前待校阅页,当判...

【专利技术属性】
技术研发人员:曹永刚
申请(专利权)人:理光图像技术上海有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1