用于提取信息的方法和装置制造方法及图纸

技术编号:24854898 阅读:76 留言:0更新日期:2020-07-10 19:08
本申请实施例公开了用于提取信息的方法和装置。该方法的一具体实施方式包括:获取第一证书图像,其中,第一证书图像中显示有目标字段;从第一证书图像中确定显示有目标字段的区域的外接几何图形作为第一外接几何图形;基于第一外接几何图形所围成的区域,提取目标字段。该实施方式降低了第一证书图像中所包括的其他区域对提取目标字段的影响。

【技术实现步骤摘要】
用于提取信息的方法和装置
本申请实施例涉及计算机
,具体涉及用于提取信息的方法和装置。
技术介绍
为了核实证书的真伪,往往需要获取证书中的文字信息。目前,主要通过人工的方式获取证书中的文字信息。
技术实现思路
本申请实施例提出了用于提取信息的方法和装置。第一方面,本申请实施例提供了一种用于提取信息的方法,该方法包括:获取第一证书图像,其中,第一证书图像中显示有目标字段;从第一证书图像中确定显示有目标字段的区域的外接几何图形作为第一外接几何图形;基于第一外接几何图形所围成的区域,提取目标字段。在一些实施例中,第一证书图像中还显示有目标图案;上述方法还包括:从第一证书图像中确定显示有目标图案的区域的外接几何图形作为第二外接几何图形。在一些实施例中,上述从第一证书图像中确定显示有目标图案的区域的外接几何图形作为第二外接几何图形,包括:对第一证书图像提取特征点,得到第一特征点集合;将第一特征点集合中的特征点与预设特征点集合中的特征点进行匹配;根据第一特征点集合中的、与预设特征点集合中的特征点匹配的至少一本文档来自技高网...

【技术保护点】
1.一种用于提取信息的方法,包括:/n获取第一证书图像,其中,所述第一证书图像中显示有目标字段;/n从所述第一证书图像中确定显示有所述目标字段的区域的外接几何图形作为第一外接几何图形;/n基于所述第一外接几何图形所围成的区域,提取所述目标字段。/n

【技术特征摘要】
1.一种用于提取信息的方法,包括:
获取第一证书图像,其中,所述第一证书图像中显示有目标字段;
从所述第一证书图像中确定显示有所述目标字段的区域的外接几何图形作为第一外接几何图形;
基于所述第一外接几何图形所围成的区域,提取所述目标字段。


2.根据权利要求1所述的方法,其中,所述第一证书图像中还显示有目标图案;以及
所述方法还包括:
从所述第一证书图像中确定显示有所述目标图案的区域的外接几何图形作为第二外接几何图形。


3.根据权利要求2所述的方法,其中,所述从所述第一证书图像中确定显示有所述目标图案的区域的外接几何图形作为第二外接几何图形,包括:
对所述第一证书图像提取特征点,得到第一特征点集合;
将所述第一特征点集合中的特征点与预设特征点集合中的特征点进行匹配;
根据所述第一特征点集合中的、与所述预设特征点集合中的特征点匹配的至少一个特征点,生成第二特征点集合;
从所述第一证书图像中确定所述第二特征点集合中的特征点所在的区域的外接几何图形作为第二外接几何图形。


4.根据权利要求2所述的方法,其中,所述从所述第一证书图像中确定显示有所述目标字段的区域的外接几何图形作为第一外接几何图形,包括:
基于所述第二外接几何图形和目标规则,从所述第一证书图像中确定显示有所述目标字段的区域的外接几何图形作为第三外接几何图形;
响应于确定所述第三外接几何图形的宽高比与目标比例之间的差距小于预设差距,将所述第三外接几何图形确定为第一外接几何图形。


5.根据权利要求4所述的方法,其中,所述从所述第一证书图像中确定显示有所述目标字段的区域的外接几何图形作为第一外接几何图形,还包括:
响应于确定所述第三外接几何图形的宽高比与所述目标比例之间的差距大于等于所述预设差距,对所述第一证书图像进行膨胀腐蚀处理,生成第二证书图像;
根据膨胀腐蚀处理结果,在所述第二证书图像中划分出至少一个第一区域;
对于所述至少一个第一区域中的第一区域,将该第一区域的外接几何图形确定为第四外接几何图形;
从所确定的第四外接几何图形集合中选取满足预设条件的至少一个第四外接几何图形;
确定包围所述至少一个第四外接几何图形的外接几何图形作为第五外接几何图形;
将所述第五外接几何图形映射到所述第一证书图像作为第一外接几何图形。


6.根据权利要求1所述的方法,其中,所述从所述第一证书图像中确定显示有所述目标字段的区域的外接几何图形作为第一外接几何图形,包括:
对所述第一证书图像进行膨胀腐蚀处理,生成第三证书图像;
根据膨胀腐蚀处理结果,在所述第三证书图像中划分出至少一个第二区域;
对于所述至少一个第二区域中的第二区域,将该第二区域的外接几何图形确定为第六外接几何图形;
从所确定的第六外接几何图形集合中选取满足所述预设条件的至少一个第六外接几何图形;
确定包围所述至少一个第六外接几何图形的外接几何图形作为第七外接几何图形;
将所述第七外接几何图形映射到所述第一证书图像作为第一外接几何图形。


7.根据权利要求1-6中任一所述的方法,其中,所述基于所述第一外接几何图形所围成的区域,提取所述目标字段,包括:
基于所述第一外接几何图形,对所述第一证书图像进行裁剪,得到第四证书图像;
对所述第四证书图像进行行切割,得到至少一个行文本图像;
从所述至少一个行文本图像中选取行文本图像,以及执行如下信息提取步骤:对选取的行文本图像进行列切割,得到文字图像集合;对文字图像集合中的文字图像进行识别,得到选取的行文本图像中的行文字信息;
响应于确定存在未选取过的行文本图像,从所述至少一个行文本图像中选取未选取过的行文本图像,以及继续执行所述信息提取步骤。


8.根据权利要求7所述的方法,其中,在所述得到至少一个行文本图像之后,所述方法还包括:
对于所述至少一个行文本图像中的行文本图像,使用目标滑动窗口在该行文本图像上进行滑动,以及对该行文本图像中的、所述目标滑动窗口所在的区域进行识别,得到至少一条文字信息;根据至少一条文字信息,生成文字信息集合。


9.根据权利要求8所述的方法,其中,所述方法还包括:
对于所得到的至少一条行文字信息中的行文字信息,使用该行文字信息到对应的文字信息集合中进行匹配;根据匹配结果,对该行文字信息进行更新。


10.根据权利要求1-6中任一所述的方法,其中,在所述获取第一证书图像之前,所述方法还包括:
获取初始证书图像;
确定所述初始证书图像中显示有证书的区域的外接几何图形作为第八外接几何图形;
根据所述第八外接几何图形,确定旋转角度;
基于所确定的旋转角度,对所述初始证书图像进行旋转处理。


11.根据权利要求10所述的方法,其中,所述获取第一证书图像,包括:
调整旋转处理后的初始证书图像的尺寸;
对调整尺寸后的初始证书图像进行二值化处理;
对二值化处理后的初始证书图像进行滤波,以及将滤波后的初始证书图像确定为第一证书图像。


12.一种用于提取信息的装置,包括:
第一获取单元,被配置成获取第一证书图像,其中,所述第一证书图像中显示有目标字段;
第一确定单元,被配置成从所述第一证书图像中确定显示有所述目标字段的区域的外接几何图形作为第一外接几何图形;
提取单元,被配置成基于所述第一外接几何图形所围成的区域,提取所述目标字段。


13.根...

【专利技术属性】
技术研发人员:宋烈金崔燕岳爱珍张铮张琳琳
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1