图片处理方法、装置、存储介质及电子设备制造方法及图纸

技术编号：24997304 阅读：23 留言：0更新日期：2020-07-24 17:59

本申请公开了一种图片处理方法、装置、存储介质及电子设备。该方法包括：获取待处理图片；调用预训练的图像语义分割模型将所述待处理图片划分为多个区域，其中，每个区域对应一类别，所述类别包括文本类别、表格类别和图片类别；从所述多个区域中确定出目标区域；对所述目标区域进行文字识别处理，以识别得到所述目标区域中的文字。本申请可以提高对图片中的文字进行识别的灵活性。

全部详细技术资料下载

【技术实现步骤摘要】
图片处理方法、装置、存储介质及电子设备
本申请属于电子
，尤其涉及一种图片处理方法、装置、存储介质及电子设备。
技术介绍
在现实生活中，文字无处不在。然而，很多文字信息最初是通过拍摄以图片形式存在的，如身份证、银行卡、护照、名片、票据、书籍等等。若需要获取这些文字信息，则需要对图片中的文字进行识别，并输出识别出的文字。在实际应用中，在需要对图片中的文字进行识别时，可能存在需要识别一张图片中的所有文字的用户需求，也可能存在仅需要识别一张图片的部分区域中的文字的用户需求。而相关技术所提供的方案仅能满足识别一张图片中的所有文字的用户需求。可见，相关技术所提供的方案的灵活性较差。
技术实现思路
本申请实施例提供一种图片处理方法、装置、存储介质及电子设备，可以提高对图片中的文字进行识别的灵活性。本申请实施例提供一种图片处理方法，包括：获取待处理图片；调用预训练的图像语义分割模型将所述待处理图片划分为多个区域，其中，每个区域对应一类别，所述类别包括文本类别、表格类别和图片类别；从所述多个区域中确定出目标区域；对所述目标区域进行文字识别处理，以识别得到所述目标区域中的文字。本申请实施例提供一种图片处理装置，包括：获取模块，用于获取待处理图片；调用模块，用于调用预训练的图像语义分割模型将所述待处理图片划分为多个区域，其中，每个区域对应一类别，所述类别包括文本类别、表格类别和图片类别；确定模块，用于从所述多个区域中确定出目标区域；识别模块...

【技术保护点】
1.一种图片处理方法，其特征在于，包括：/n获取待处理图片；/n调用预训练的图像语义分割模型将所述待处理图片划分为多个区域，其中，每个区域对应一类别，所述类别包括文本类别、表格类别和图片类别；/n从所述多个区域中确定出目标区域；/n对所述目标区域进行文字识别处理，以识别得到所述目标区域中的文字。/n

【技术特征摘要】
1.一种图片处理方法，其特征在于，包括：
获取待处理图片；
调用预训练的图像语义分割模型将所述待处理图片划分为多个区域，其中，每个区域对应一类别，所述类别包括文本类别、表格类别和图片类别；
从所述多个区域中确定出目标区域；
对所述目标区域进行文字识别处理，以识别得到所述目标区域中的文字。

2.根据权利要求1所述的图片处理方法，其特征在于，所述获取待处理图片之前，还包括：
获取样本图片，所述样本图片包括多个样本区域，每个样本区域对应一类别；
获取待训练的图像语义分割模型；
利用所述样本图片对所述待训练的图像语义分割模型进行训练。

3.根据权利要求1所述的图片处理方法，其特征在于，所述目标区域包括表格区域，所述对所述目标区域进行文字识别处理，以识别得到所述目标区域中的文字之后，还包括：
识别所述表格区域中的表格的行数与列数；
根据所述行数与列数，生成表格；
将所述文字填充至所述表格中。

4.根据权利要求3所述的图片处理方法，其特征在于，所述目标区域还包括文本区域，所述将所述文字填充至所述表格中之后，还包括：
根据所述待处理图片的排版格式，对所述表格和从所述文本区域中识别出的文字进行排版；
输出排版后的表格和从所述文本区域中识别出的文字。

5.根据权利要求4所述的图片处理方法，其特征在于，所述输出排版后的表格和从所述文本区域中识别出的文字，包括：
显示编辑界面，所述编辑界面为供用户进行编辑操作的界面；
将排版后的表格和从所述文本区域中识别出的文字输出至所述编辑界面。

6.根据权利要求1所述的图片处理方法，其特征在于，所述对所述目标区域进行文...

【专利技术属性】
技术研发人员：刘鹏，
申请(专利权)人：OPPO广东移动通信有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人