一种基于去模糊的OCR识别方法及服务器技术

技术编号:38074894 阅读:9 留言:0更新日期:2023-07-06 08:43
本发明专利技术提供了一种基于去模糊的OCR识别方法以及服务器,应用于区块链连接的多类型金融服务平台,通过对金融图像失真类型判断从而在选择页面展示修复模型,使有权限的工作人员可以选择适宜的修复模型组合。之后根据选择的修复模型所属的数据库去直接调用或者间接调用修复模型,再进行多角度插值修复,提高金融图像的修复质量。再修复完成之后,利用使用OCR技术提取修复后的图像中的文本边界点,再扩充文本的所属区域,之后进行切割、识别得到文本信息。本发明专利技术相交于现有技术可以满足不同金融服务程序对图像的质量需求,无需用户反复去调整拍摄角度。此外通过跨域调用可以降低各个金融服务平台构建修复模型的负荷,提高金融服务平台服务效率。台服务效率。台服务效率。

【技术实现步骤摘要】
一种基于去模糊的OCR识别方法及服务器


[0001]本专利技术属于金融图像、文本识别
,具体涉及一种基于去模糊的OCR识别方法及服务器。

技术介绍

[0002]图像去模糊(image deblurring)技术是低层次计算机领域的一项经典任务,其目的是从模糊的输入图像中恢复清晰的图像,图像模糊的因素有多种,如失焦、相机抖动或目标快速运动等。基于去模糊的OCR技术,在进行OCR识别之前对图像进行去模糊,可以提升OCR识别率,提升识别效率。
[0003]在金融行业中,常常借助OCR识别技术协助客户完成线上相关业务的办理,例如注册、录入营业执照、录入个人身份信息或个人银行卡信息,而在录入时常常因为抖动、失焦、光线阴暗等各种原因引起的图像模糊,使得金融系统在识别这些图像获取信息的过程变得极为艰难。且由于各个金融机构系统的差异性,在进行OCR识别时对于图像的质量要求不一,客户常常需要变换各种角度或者变换各种背景以满足系统对图像的质量需求,造成客户时间以及精力的浪费,从而可能丢失客户。

技术实现思路

[0004]为了解决现有技术中存在的上述问题,本专利技术提供了一种基于去模糊的OCR识别方法及服务器。本专利技术要解决的技术问题通过以下技术方案实现:第一方面,本专利技术提供了一种基于去模糊的OCR识别方法,应用于多类型的金融服务平台,所述金融服务平台运行有至少一种金融服务程序,所述多类型的金融服务平台通过统一的API网关实现对接,所述的一种基于去模糊的OCR识别方法包括:S1,每个类型的金融服务平台,用于接收用户通过采集设备上传的金融图像,所述金融图像包括用户头像、身份信息、银行账户信息中的一种或者几种;S2,对所述金融图像的失真类型进行判断,并根据所述金融图像的失真类型导入选择界面;S3,在所述选择界面接收由权限人员按照规则选择的修复操作,并按照所述修复操作启动API调用接口,从自身的数据库调用对应的修复模型或以跨域加密方式从其他金融服务平台获取并调用对应的修复模型;S4,利用调用来的修复模型对所述金融图像进行像素点多角度插值修复,获得修复后的图像;S5,使用OCR技术提取所述修复后的图像中的文本边界点;S6,将在所述文本边界点邻域内的像素点作为文本的相关点;S7,在所述相关点形成的闭合形状按照像素块进行切割,并对切割得到的像素块进行OCR识别,得到识别的文本信息;S8,将所述文本信息、修复后的图像以及对应的修复模型存储至自身的数据库。
[0005]第二方面,本专利技术提供了一种基于去模糊的OCR识别服务器,应用于多类型的金融服务平台,所述金融服务平台运行有至少一种金融服务程序,所述多类型的金融服务平台通过统一的API网关实现对接,所述的一种基于去模糊的OCR识别服务器具体用于:按照金融服务平台分配的子任务执行下述过程:接收用户通过采集设备上传的金融图像,所述金融图像包括用户头像、身份信息、银行账户信息中的一种或者几种;对所述金融图像的失真类型进行判断,并根据所述金融图像的失真类型导入选择界面;在所述选择界面接收由权限人员按照规则选择的修复操作,并按照所述修复操作启动API调用接口,从金融服务平台的数据库调用对应的修复模型或以跨域加密方式从其他金融服务平台获取并调用对应的修复模型;利用调用来的修复模型对所述金融图像进行像素点多角度插值修复,获得修复后的图像;使用OCR技术提取所述修复后的图像中的文本边界点;将在所述文本边界点邻域内的像素点作为文本的相关点;在所述相关点形成的闭合形状按照像素块进行切割,并对切割得到的像素块进行OCR识别,得到识别的文本信息;将所述文本信息、修复后的图像以及对应的修复模型存储至金融服务平台的数据库。
[0006]本专利技术提供了一种基于去模糊的OCR识别方法以及服务器,应用于区块链连接的多类型金融服务平台,通过对金融图像失真类型判断从而在选择页面展示修复模型,使有权限的工作人员可以选择适宜的修复模型组合。之后根据选择的修复模型所属的数据库去直接调用或者间接调用修复模型,再进行多角度插值修复,提高金融图像的修复质量。再修复完成之后,利用使用OCR技术提取修复后的图像中的文本边界点,再扩充文本的所属区域,之后进行切割、识别得到文本信息。本专利技术相交于现有技术可以满足不同金融服务程序对图像的质量需求,无需用户反复去调整拍摄角度。此外通过跨域调用可以降低各个金融服务平台构建修复模型的负荷,提高金融服务平台服务效率。
[0007]以下将结合附图及实施例对本专利技术做进一步详细说明。
附图说明
[0008]图1是本专利技术提供的金融服务平台的示意图;图2是本专利技术提供的一种基于去模糊的OCR识别方法的流程示意图。
具体实施方式
[0009]下面结合具体实施例对本专利技术做进一步详细的描述,但本专利技术的实施方式不限于此。
[0010]本专利技术提供了一种基于去模糊的OCR识别方法,应用于多类型的金融服务平台。如图1所示,所述金融服务平台运行有至少一种金融服务程序,多类型的金融服务平台通过统一的API网关实现对接。每种金融服务程序运行在集群服务器上,每种金融服务程序所运行
的集群服务器与其他金融服务程序所运行的集群服务器构成区块链,每个金融服务程序的区块链上存储有公钥、修复模型所在数据库标识以及协议认证方式。
[0011]值得说明的是:多类型的金融服务平台可以为国家银行、政府金融监管等服务平台,类型是指业务不同的金融服务平台。
[0012]如图2所示,本专利技术提供了一种基于去模糊的OCR识别方法包括:S1,每个类型的金融服务平台,用于接收用户通过采集设备上传的金融图像,所述金融图像包括用户头像、身份信息、银行账户信息中的一种或者几种;值得说明的是:本申请中的金融图像可以是用户的身份证图像,用户通过摄像设备拍摄的脸部视频或图像,也可以是银行卡的卡号或账号,当然几种图像可以组合。在金融行业中,提供资料的目的在于确认用户是否是本人或者符合国家法律规定的委托代理人。因此在办理金融业务的过程中为实现上述目的提供的相关证件图像或资料图像都可以应用在本专利技术中,本专利技术对此不做任何限制。
[0013]S2,对所述金融图像的失真类型进行判断,并根据所述金融图像的失真类型导入选择界面;值得说明的是:由于金融图像可能因为角度、遮挡、光线、焦点等原因造成失真,如果失真之后图像在导入系统时会不能识别或者识别错误的情况。对失真类型判断可以为后续修复金融图像提供合适的修复模型,如此提高修复的效率。
[0014]S3,在所述选择界面接收由权限人员按照规则选择的修复操作,并按照所述修复操作启动API调用接口,从自身的数据库调用对应的修复模型或以跨域加密方式从其他金融服务平台获取并调用对应的修复模型;值得说明的是:金融服务程序可以以APP的形式运行在电子设备或服务器上,方便工作人员展示和操作。在金融服务程序上可以设备选择界面,这个选择界面可以展示修复模型,而有些修复模型在其他金融服务平台上,在调用过程中为保证客户以及平台的安全性,并不能直接调用。而需要通过一些加密方式传输,这样对于自身的金融服务平台本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于去模糊的OCR识别方法,应用于多类型的金融服务平台,所述金融服务平台运行有至少一种金融服务程序,其特征在于,所述多类型的金融服务平台通过统一的API网关实现对接,所述的一种基于去模糊的OCR识别方法包括:S1,每个类型的金融服务平台,用于接收用户通过采集设备上传的金融图像,所述金融图像包括用户头像、身份信息、银行账户信息中的一种或者几种;S2,对所述金融图像的失真类型进行判断,并根据所述金融图像的失真类型导入选择界面;S3,在所述选择界面接收由权限人员按照规则选择的修复操作,并按照所述修复操作启动API调用接口,从自身的数据库调用对应的修复模型或以跨域加密方式从其他金融服务平台获取并调用对应的修复模型;S4,利用调用来的修复模型对所述金融图像进行像素点多角度插值修复,获得修复后的图像;S5,使用OCR技术提取所述修复后的图像中的文本边界点;S6,将在所述文本边界点邻域内的像素点作为文本的相关点;S7,在所述相关点形成的闭合形状按照像素块进行切割,并对切割得到的像素块进行OCR识别,得到识别的文本信息;S8,将所述文本信息、修复后的图像以及对应的修复模型存储至自身的数据库。2.根据权利要求1所述的一种基于去模糊的OCR识别方法,其特征在于,S2包括:S211,确定所述金融图像中的多个角点以及角点的像素值,如果多个角点的像素值之间的差异大于像素阈值,则确定金融图像发生抖动引起的角度变化;S221,对多个角点之间连线形成交叠的线段,其中相邻的角点之间不连接;S231,以交叠的线段最多的点为坐标中心,以水平线为横轴建立二维坐标系;S241,在所述二维坐标系下确定所述金融图像的因抖动引起的变化角度;S251,根据所述变化角度,确定所述金融图像的失真类型为角度失真类型;S261,根据所述金融图像的所述角度失真类型,导入选择界面;其中,所述选择界面包括角度失真类型对应的多个角度修复模型,所述多个角度修复模型以下拉方式或界面显示呈现在所述选择界面。3.根据权利要求1所述的一种基于去模糊的OCR识别方法,其特征在于,S2包括:S212,提取所述金融图像的边缘点,如果边缘点的个数小于边缘点阈值,则确认所述金融图像出现焦点模糊;S222,对所述金融图像在横向和纵向上分别进行差分计算,如果横向和纵向的差分计算结果的差异值小于差异值阈值,则确定所述金融图像的失真类型为失焦失真类型;S232,根据所述金融图像的失焦失真类型,导入选择界面;其中,所述选择界面包括失焦失真类型对应的不同失焦修复模型以及对应的组合顺序,每个组合顺序对应一张示例图像。4.根据权利要求2或3所述的一种基于去模糊的OCR识别方法,其特征在于,S3包括:S31,每个类型的金融服务平台在自身的选择界面接收由验证信息,以验证在操作界面操作的账号是否为金融服务平台的工作账号;S32,如果为工作账号,则根据金融服务平台上虚拟角色所对应的权限为该工作账号分
配对应的权限;其中,虚拟角色自上而下形成角色树,距离角色树中上级节点所包含的权限大于下级节点的权限;S33,在所述选择界面展示所述工作账号所分配的权限选项,以使操作所述工作账号的权限人员根据权限选项选择修复操作;S34,接收修复操作,并确定所述修复操作所需的修复模型以及修复模型所属的数据库标识;S35,根据数据库标识,判断所需的修复模型位于自身的数据库还是其他域的数据库;S36,如果所需的修复模型位于自身的数据库,则启动API调用接口从自身数据库调用所需的修复模型;S37,如果所需的修复模型位于其他域的数据库,则进一步判断其他域的数据库是否对所述工作账号开放,如果否,则根据不同域的认证协议执行域间认证,并在认证之后启动API调用接口从其他域的数据库调用所需的修复模型;S38,如果其他域的数据库对所述工作账号开放,则启动API调用接口从其他域的数据库调用所需的修复模型。5.根据权利要求4所述的一种基于去模糊的OCR识...

【专利技术属性】
技术研发人员:周玉林杨成林汪晓东易悠李志岳志远丁丁
申请(专利权)人:湖南三湘银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1