【技术实现步骤摘要】
文档生成方法、装置、平台、电子设备以及存储介质
[0001]本公开涉及人工智能
,尤其涉及计算机视觉和深度学习
,可应用于文字识别等场景,具体涉及文档生成方法、装置、平台、电子设备、存储介质以及程序产品。
技术介绍
[0002]纸质文档电子化的需求广泛存在于日常的生产生活中,例如票据、证件、业务账单等文档的电子录入、存储、管理等。OCR(Optical CharacterRecognition,光学字符识别)技术为纸质文档电子化带来前所未有的变化。提高电子化的处理效率,解放人力。但是随着纸质文档的类型的不断增加,对OCR技术的要求也在不断地提升。
技术实现思路
[0003]本公开提供了一种文档生成方法、装置、平台、电子设备、存储介质以及程序产品。
[0004]根据本公开的一方面,提供了一种文档生成方法,包括:对文档图片进行类别识别,得到目标类别结果;确定与所述目标类别结果相匹配的目标结构化模型;以及利用所述目标结构化模型,对所述文档图片进行结构识别,得到结构识别结果,以便基于所述结构识别结 ...
【技术保护点】
【技术特征摘要】
1.一种文档生成方法,包括:对文档图片进行类别识别,得到目标类别结果;确定与所述目标类别结果相匹配的目标结构化模型;以及利用所述目标结构化模型,对所述文档图片进行结构识别,得到结构识别结果,以便基于所述结构识别结果生成电子文档,其中,所述结构识别结果包括字段属性识别结果和字段位置识别结果。2.根据权利要求1所述的方法,其中,所述对文档图片进行类别识别,得到目标类别结果包括:对所述文档图片进行类别识别,得到类别结果;从至少一个模板类别中识别与所述类别结果相匹配的目标类别结果;以及在确定检测到所述目标类别结果的情况下,执行所述确定与所述目标类别结果相匹配的目标结构化模型的操作。3.根据权利要求1所述的方法,还包括,在所述利用所述目标结构化模型,对所述文档图片进行结构识别,得到结构识别结果之前:识别所述文档图片的图像方向;以及在所述图像方向与目标方向不匹配的情况下,对所述文档图片进行旋转校正。4.根据权利要求1所述的方法,其中,所述利用所述目标结构化模型,对所述文档图片进行结构识别,得到结构识别结果包括:利用所述目标结构化模型,对所述文档图片进行结构识别,从多个初始字段结构中确定所述结构识别结果。5.根据权利要求1或4所述的方法,还包括,在所述利用所述目标结构化模型,对所述文档图片进行结构识别,得到结构识别结果之后:基于所述字段位置识别结果,提取目标字段文字;以及对所述目标字段文字进行文字识别,得到文字识别结果。6.根据权利要求1所述的方法,还包括,在所述对文档图片进行类别识别,得到类别结果之前:对初始图片进行主体检测,得到主体位置结果;以及基于所述主体位置结果,从所述初始图片中得到所述文档图片。7.根据权利要求1
‑
6任一项所述的方法,其中,所述文档图片包括纸质文档或电子文档的图片。8.一种文档生成装置,包括:类别识别模块,用于对文档图片进行类别识别,得到目标类别结果;模型匹配模块,用于确定与所述目标类别结果相匹配的目标结构化模型;以及结构识别模块,用于利用所述目标结构化模型,对所述文档图片进行结构识别,得到结构识别结果,以便基于所述结构识别结果生成电子文档,其中,所述结构识别结果包括字段属性识别结果和字段位置识别结果。9.根据权利要求8所述的装置,其中,所述类别识别模块包括:类别识别单元,用于对所述文档图片进行类别识别,得到类别结果;匹配单元,用于从至少一个模板类别中识别与所述类别结果相匹配的目标类别结果;<...
【专利技术属性】
技术研发人员:谢群义,钦夏孟,恩孟一,张栋栋,黄聚,徐杨柳,陈毅,姚锟,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。