一种结构化信息生成方法、装置、电子设备和可读介质制造方法及图纸

技术编号:41328815 阅读:21 留言:0更新日期:2024-05-13 15:07
本公开的实施例公开了一种结构化信息生成方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:获取目标图像;在目标图像中截取文本行图像块;确定文本行图像块的信息类别和信息内容;根据信息类别和信息内容生成关于目标图像的结构化信息。该实施方式能够快速而准确地从目标图像的信息展示区域块中提取出结构化文本信息数据,实现文本内容的分类,从而降低图片中文本信息数据结构化处理的计算量,同时能够适宜在计算力相对服务器端较弱的移动终端部署。

【技术实现步骤摘要】

本公开的实施例涉及计算机,具体涉及一种结构化信息生成方法、装置、电子设备和计算机可读介质。


技术介绍

1、随着移动终端网络通信技术和移动终端信息处理技术的快速发展,运行于移动终端的各类应用程序呈爆炸式增长。人们通过移动终端的各类应用程序开展购物、交流、学习等各项业务,其日常生活已经越来越离不开移动终端应用程序的使用。移动终端应用程序使用过程中的相关信息数据是重要的信息来源,大数据平台为了更好地满足用户的需求,制定更为有效的营销策略和服务方案,需要快速、准确地获取海量的用户端的信息数据,并以此为基础进行数据分析和数据挖掘。

2、传统的网页爬虫技术无法采集到移动终端界面中的完整的信息数据。而如果移动终端将包含信息数据的界面截图发送到服务器端,通过服务器端从海量的图片中分析提取信息数据,这种方式则对服务器端的数据计算处理能力造成极大的挑战。

3、另外,传统的从图像中提取文本的方法利用ocr识别技术从图像中提取出的文本后,需要进行数据结构化处理;一般的数据结构化的思路是根据业务需求设计一套规则提取出若干关键信息。传统方法的缺陷在于泛化能力差本文档来自技高网...

【技术保护点】

1.一种结构化信息生成方法,包括:

2.根据权利要求1所述的方法,其中,所述在所述目标图像中截取文本行图像块,包括:

3.根据权利要求2所述的方法,其中,所述确定所述文本行以及所述文本行的相邻文本行的文本行类别,包括:

4.根据权利要求1所述的方法,其中,所述确定所述文本行图像块的信息类别和信息内容,包括:

5.根据权利要求1所述的方法,其中,所述获取目标图像,包括:

6.一种用于结构化信息生成的装置,包括:

7.一种电子设备,包括:

8.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执...

【技术特征摘要】

1.一种结构化信息生成方法,包括:

2.根据权利要求1所述的方法,其中,所述在所述目标图像中截取文本行图像块,包括:

3.根据权利要求2所述的方法,其中,所述确定所述文本行以及所述文本行的相邻文本行的文本行类别,包括:

4.根据权利要求1所述的方法,其中,所述确定所述文本行图像块的...

【专利技术属性】
技术研发人员:宁伟钟镇洪
申请(专利权)人:深圳爱数云科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1