【技术实现步骤摘要】
本专利技术涉及图文识别
尤其涉及一种二次录入不一致的仲裁方法及装置。
技术介绍
OCR(Optical Character Recognition,光学字符识别)是通过扫描等光学输入方式将各种票据、书籍等文本资料进行扫描,将文本信息转化为图像信息,然后通过字符识别技术对图像信息进行分析处理,最终转化为计算机文字录入到电脑中的技术过程。适合于银行、税务等行业大量票据表格的自动扫描识别及长期存储。在银行日常业务的票据资料处理中,存在大量的数字、文字录入工作,而在纸质资料电子化过程中,为保证票据录入结果的正确性,必须对录入的内容进行核对。现有的核对手段以二次录入校验为主,即同一段资料输入两次(由同一个人或者不同人),输入后由计算机逐笔核对,凡不一致的则拒绝接受,对于二次录入校验不一致的部分,仲裁过程主要是:计算机分别展示两次录入的完整内容;第三人观察两次录入不一致的部分,并根据录入内容所依据的纸质凭证的原始扫描影像中相对应的部分,仲裁选择其认为正确的录入结果。该方法是由计算机直接展示票据的完整影像供人工直接观测作为仲裁依据,但受限于现有技术,人工对两次录入的完整内容进行阅读,信息量多、观测时间长,增加了辨识难度和工作量。
技术实现思路
本专利技术实施例所要解决的技术问题在于,提供一种二次录入不一致的仲裁方法及装置,通过标识二次录入不一致的内容,提取对应原始影像中的内容并进行突出展示从 ...
【技术保护点】
一种二次录入不一致的仲裁方法,其特征在于,包括:检测到两次录入信息不一致时,采集两次录入信息及对应的原始影像,所述两次录入信息为同一张凭证上的数据的两次输入,对应的原始影像为所述两次录入信息所依据的凭证的扫描影像;对比所述两次录入信息,获取所述两次录入信息中不一致部分的位置参数;根据所述不一致部分的位置参数将所述两次录入信息中不一致部分进行标识,根据所述不一致部分的位置参数将对应的原始影像中所述不一致部分进行定位和突出展示。
【技术特征摘要】
1.一种二次录入不一致的仲裁方法,其特征在于,包括:
检测到两次录入信息不一致时,采集两次录入信息及对应的原始影像,所
述两次录入信息为同一张凭证上的数据的两次输入,对应的原始影像为所述两
次录入信息所依据的凭证的扫描影像;
对比所述两次录入信息,获取所述两次录入信息中不一致部分的位置参数;
根据所述不一致部分的位置参数将所述两次录入信息中不一致部分进行标
识,根据所述不一致部分的位置参数将对应的原始影像中所述不一致部分进行
定位和突出展示。
2.如权利要求1所述的方法,其特征在于,所述采集两次录入信息,包括:
所述两次录入信息包括至少一个字符串,其中字符串包括至少一个字符;
采集同一张凭证的两次录入的所有字符串或者采集同一张凭证的两次录入
不一致部分的字符串。
3.如权利要求2所述的方法,其特征在于,对比所述两次录入信息,获取
所述两次录入信息中不一致部分的位置参数,包括:
将所述采集的两次录入信息以字符串为单位从首位字符开始逐位进行比对;
根据所述比对结果生成所述两次录入信息中不一致字符串中不一致字符的
位置参数n(k),其中n表示两次录入信息中两次录入的同一字符串的最大总字
符数,k表示该字符串中的第k位字符,其中n、k为大于等于1的正整数且n
大于等于k;
记录所述两次录入信息中字符串中不一致字符的位置参数n(k)。
4.如权利要求3所述的方法,其特征在于,所述根据所述不一致部分的位
置参数将所述两次录入信息中不一致部分进行标识,包括:
将所述两次录入信息中不一致部分相对应的字符串进行上下对齐展示,且
字符串中的字符从首位到第n位逐位对齐;
根据所述不一致字符的位置参数n(k),将所述对齐展示的字符串相对应的
\t位置参数n(k)所对应的不一致字符以鲜明颜色进行标注并展示。
5.如权利要求4所述的方法,其特征在于,所述根据所述不一致部分的位
置参数将对应的原始影像中所述不一致部分进行定位和突出展示,包括:
预先录入两次录入信息所对应的原始影像模板,所述原始影像模板为所述
对应原始影像所依据的凭证未录入信息前的1:1大小的版面图;
预先测定并保存录入信息区域在所述原始影像模板上的区域坐标;
调用与所述两次录入信息相匹配的原始影像模板以获取录入信息区域在所
述原始影像模板上的区域坐标;
根据所述两次录入信息中不一致的字符串的总字符数n,从字符串中字符的
排列方向将所述原始影像模板上相应的区域坐标平均分割为n块,并结合所述
字符串中不一致字符的位置参数n(k),确定不一致字符的区域坐标;
根据所述确定的不一致字符的区域坐标,对所述对应的原始影像中相应区
域坐标中的不一致字符进行突出展示。
6.如权利要求5所述的方法,其特征在于,根据所述两次录入信息中不一
致的字符串的总字符数n,从字符串中字符的排列方向将所述原始影像模板上相
应的区域坐标平均分割为n块,并结合所述字符串中不一致字符的位置参数n
(k),确定不一致字符的区域坐标,包括:
判断所述两次录入信息中不一致的字符串中的字符的区域坐标是否模块化,
所述模块化表示以固定大小格式填写所述两次录入信息中的字符;
若模块化,获取模板中对应的字符的模块化的区域坐标;
根据所述字符串中不一致字符的位置参数n(k)并结合所述字符的模块化
的区域坐标,确定不一致字符的区域坐标;
若非模块化,获取模板中对应的非模块化的两次录入信息中字符串的区域
坐标M;
根据区域坐标M并结合OCR识别技术进一步确认原始影像中录入信息区
域中已填写的字符串的区域坐标M',其中M'小于等于M;
根据字符串的总字符数n,从字符串中字符的排列方向将所述已填写的字符
串的区域坐标M'平均分割为n块以确定字符串中字符的区域坐标;
根据所述字符串中不一致字符的位置参数n(k)并结合所述已确定的字符
串中字符的区域坐标,得到所述不一致字符的区域坐标。
7.如权利要求5和6所述的方法,其特征在于,所述根据所述确定的不一
致字符的区域坐标,对所述对应的原始影像中相应区域坐标中的不一致字符进
行突出展示,包括:
根据所述确定的不一致字符的区域坐标,提取所述原始影像中相对应的不
一致字符的区域坐标所对应的突出影像;
将所述提取后的原始影像中相对应的不一致字符的区域坐标所对应的突出
影像按比例进行多级范围扩大展示,所述多级范围包括所述不一致字符的区域
坐标到不一致字符所在字符串的完整区域坐标。
8.如权利要求1-7所述的方法,其特征在于,所述根据所述不一致部分的
位置参数将对应的原始影像中所述不一致部分进行定位和突出展示之后,还包
括:
将所述进行标识的两次录入信息中不一致部分和所述进行突出展示的两次
录入信息中不一致部分所对应的原始影像进行同时展示并对比。
9...
【专利技术属性】
技术研发人员:郑邦东,黄丹青,吴渊,胡晓斌,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。