一种结构化信息的生成方法、装置和计算机可读存储介质制造方法及图纸

技术编号:33436344 阅读:32 留言:0更新日期:2022-05-19 00:25
本申请公开了一种结构化信息的生成方法、装置和计算机可读存储介质,该方法包括:获取模板图像,模板图像包括多个参照字段与多个识别区,识别区与参照字段所在的区域不同;对获取到的第一图像进行方向矫正处理,得到第二图像;对第二图像进行文本识别处理,得到文本识别结果;将文本识别结果与参照字段进行匹配,得到匹配结果;基于匹配结果对第二图像进行矫正,得到第三图像,第三图像的角度与模板图像的角度相同;基于文本识别结果、识别区以及第三图像,生成结构化信息。通过上述方式,本申请能够提升效率,且适应性较广。且适应性较广。且适应性较广。

【技术实现步骤摘要】
一种结构化信息的生成方法、装置和计算机可读存储介质


[0001]本申请涉及图像处理
,具体涉及一种结构化信息的生成方法、装置和计算机可读存储介质。

技术介绍

[0002]每天有大量的信息生成,需要从这些信息中筛选出关键的信息,以便进行存储或管理;例如,以电动车的登记管理为例,需要提交电动车的合格证等资料,通过人工手动进行电动车的合格证信息的录入和识别,效率低、时间长,且极易出现录入错误,无法对录入和识别过程进行记录和追溯。

技术实现思路

[0003]本申请提供一种结构化信息的生成方法、装置和计算机可读存储介质,能够提升效率,且适应性较广。
[0004]为解决上述技术问题,本申请采用的技术方案是:提供一种结构化信息的生成方法,该方法包括:获取模板图像,模板图像包括多个参照字段与多个识别区,识别区与参照字段所在的区域不同;对获取到的第一图像进行方向矫正处理,得到第二图像;对第二图像进行文本识别处理,得到文本识别结果;将文本识别结果与参照字段进行匹配,得到匹配结果;基于匹配结果对第二图像进行矫正,得到第三图像,第三图像的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种结构化信息的生成方法,其特征在于,包括:获取模板图像,所述模板图像包括多个参照字段与多个识别区,所述识别区与所述参照字段所在的区域不同;对获取到的第一图像进行方向矫正处理,得到第二图像;对所述第二图像进行文本识别处理,得到文本识别结果;将所述文本识别结果与所述参照字段进行匹配,得到匹配结果;基于所述匹配结果对所述第二图像进行矫正,得到第三图像,所述第三图像的角度与所述模板图像的角度相同;基于所述文本识别结果、所述识别区以及所述第三图像,生成结构化信息。2.根据权利要求1所述的结构化信息的生成方法,其特征在于,所述对获取到的第一图像进行方向矫正处理,得到第二图像的步骤之前,包括:获取与所述识别区对应的识别名称字段,所述识别名称字段所在的区域与所述识别区不同;建立所述识别名称字段与所述识别区的对应关系,得到映射表。3.根据权利要求2所述的结构化信息的生成方法,其特征在于,所述文本识别结果包括多个子识别结果,所述基于所述文本识别结果、所述识别区以及所述第三图像,生成结构化信息的步骤,包括:将所述子识别结果所在的区域的位置与所述识别区的位置进行匹配,得到候选区;将所述候选区对应的子识别结果与所述映射表进行匹配,得到所述子识别结果的识别名称;将所述识别名称以及与所述识别名称对应的子识别结果,确定为所述结构化信息。4.根据权利要求3所述的结构化信息的生成方法,其特征在于,所述匹配结果包括多个匹配字段,所述基于所述匹配结果对所述第二图像进行矫正,得到第三图像的步骤,包括:判断所述子识别结果与所述参照字段的相似度是否大于预设相似度;若是,则将所述子识别结果确定为所述匹配字段;基于所述匹配字段,对所述第二图像进行透视变换,得到所述第三图像。5.根据权利要求2所述的结构化信息的生成方法,其特征在于,所述文本识别结果包括多个子识别结果,所述基于所述文本识别结果、所述识别区以及所述第三图像,生成结构化信息的步骤,包括:将所述子识别结果与所述映射表进行匹配,得到识别名称;将所述识别名称以及与所述识别名称对应的子识别结果,确定为所述结构化信息。6.根据权利要求1所述的结构化信息的生成方法,其特征在于,所述对获取到的第一图像进行方向矫正处理,得...

【专利技术属性】
技术研发人员:游照林熊剑平陈媛媛
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1