图片处理方法、装置、存储介质及电子设备制造方法及图纸

技术编号:24997304 阅读:23 留言:0更新日期:2020-07-24 17:59
本申请公开了一种图片处理方法、装置、存储介质及电子设备。该方法包括:获取待处理图片;调用预训练的图像语义分割模型将所述待处理图片划分为多个区域,其中,每个区域对应一类别,所述类别包括文本类别、表格类别和图片类别;从所述多个区域中确定出目标区域;对所述目标区域进行文字识别处理,以识别得到所述目标区域中的文字。本申请可以提高对图片中的文字进行识别的灵活性。

【技术实现步骤摘要】
图片处理方法、装置、存储介质及电子设备
本申请属于电子
,尤其涉及一种图片处理方法、装置、存储介质及电子设备。
技术介绍
在现实生活中,文字无处不在。然而,很多文字信息最初是通过拍摄以图片形式存在的,如身份证、银行卡、护照、名片、票据、书籍等等。若需要获取这些文字信息,则需要对图片中的文字进行识别,并输出识别出的文字。在实际应用中,在需要对图片中的文字进行识别时,可能存在需要识别一张图片中的所有文字的用户需求,也可能存在仅需要识别一张图片的部分区域中的文字的用户需求。而相关技术所提供的方案仅能满足识别一张图片中的所有文字的用户需求。可见,相关技术所提供的方案的灵活性较差。
技术实现思路
本申请实施例提供一种图片处理方法、装置、存储介质及电子设备,可以提高对图片中的文字进行识别的灵活性。本申请实施例提供一种图片处理方法,包括:获取待处理图片;调用预训练的图像语义分割模型将所述待处理图片划分为多个区域,其中,每个区域对应一类别,所述类别包括文本类别、表格类别和图片类别;从所述多个区域中确定出目标区域;对所述目标区域进行文字识别处理,以识别得到所述目标区域中的文字。本申请实施例提供一种图片处理装置,包括:获取模块,用于获取待处理图片;调用模块,用于调用预训练的图像语义分割模型将所述待处理图片划分为多个区域,其中,每个区域对应一类别,所述类别包括文本类别、表格类别和图片类别;确定模块,用于从所述多个区域中确定出目标区域;识别模块,用于对所述目标区域进行文字识别处理,以识别得到所述目标区域中的文字。本申请实施例提供一种存储介质,其上存储有计算机程序,当所述计算机程序在计算机上执行时,使得所述计算机执行本申请实施例提供的图片处理方法中的流程。本申请实施例还提供一种电子设备,包括存储器,处理器,所述处理器通过调用所述存储器中存储的计算机程序,用于执行本申请实施例提供的图片处理方法中的流程。本申请实施例中,可调用预训练的图像语义分割模型将待处理图片划分为多个区域,从而在仅需要识别多个区域中的某一个区域的文字时,可以将该区域确定为目标区域;在需要识别出整个待处理图片中的文字时,可将该多个区域均确定为目标区域,再对确定出的目标区域进行文字识别处理。可见,本申请实施例提供的图片处理方法可以提高对图片中的文字进行识别的灵活性。附图说明下面结合附图,通过对本申请的具体实施方式详细描述,将使本申请的技术方案及其有益效果显而易见。图1是本申请实施例提供的图片处理方法的第一种流程示意图。图2是本申请实施例提供的待处理图片示意图。图3是本申请实施例提供的场景示意图。图4是本申请实施例提供的图片处理方法的第二种示意图。图5是本申请实施例提供的图像语义分割模型的网络结构示意图。图6是本申请实施例提供的图片处理装置的结构示意图。图7是本申请实施例提供的电子设备的第一种结构示意图。图8是本申请实施例提供的电子设备的第二种结构示意图。图9是本申请实施例提供的图像处理电路的结构示意图。具体实施方式请参照图示,其中相同的组件符号代表相同的组件,本申请的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本申请具体实施例,其不应被视为限制本申请未在此详述的其它具体实施例。可以理解的是,本申请实施例的执行主体可以是诸如智能手机或平板电脑等电子设备。请参阅图1,图1是本申请实施例提供的图片处理方法的第一种流程示意图,流程可以包括:在101中,获取待处理图片。其中,该待处理图片的类别可至少包括两种类别。比如,若某图片中包括文本和图片,则该图片的类别可以包括文本类别和图片类别,电子设备可将该图片确定为待处理图片。又比如,若某图片中包括文本、图片和表格,则该图片的类别可以包括文本类别、图片类别和表格类别,电子设备可将该图片确定为待处理图片。例如,该待处理图片可如图2所示。该待处理图片G1中包括文本、表格和图片。该待处理图片G1的类别可以包括文本类别、表格类别和图片类别。在102中,调用预训练的图像语义分割模型将待处理图片划分为多个区域,其中,每个区域对应一类别,该类别包括文本类别、表格类别和图片类别。相关技术中,在对图片进行文字识别时,通常会将该图片中包含的全部文字识别处理。以如图2所示的待处理图片G1为例,若采用相关技术提供的方案对该待处理图片G1进行文字识别,那么,无论是图片中的文本区域的文字,还是表格区域的文字,亦或是图片区域中的文字,均会被识别并输出。然而,用户可能仅需要得到文本区域的文字,若采用相关技术的方案,用户还得将识别出来的表格区域和图片区域的文字删除,才能得到文本区域的文字,这一过程相当麻烦。因此,在本申请实施例中,在获取待处理图片,并对待处理图片进行文字识别之前,电子设备会先调用预训练的图像语义分割模型将待处理图片划分为多个区域。其中,每个区域对应一类别,该类别包括文本类别、表格类别和图片类别。如图3所示,待处理图片G1将会被划分为3个区域,分别为文本所在的文本区域A1、表格所在的表格区域A2和图片所在的图片区域A3。其中,文本区域A1对应文本类别,文本区域A2对应表格类别,文本区域A3对应图片类别。在一些实施例中,电子设备可预先对u-net网络进行训练,并将训练好的u-net网络作为预训练的图像语义分割模型。在103中,从多个区域中确定出目标区域。比如,可以由用户从多个区域中指定出目标区域。例如,若用户想识别表格区域的文字,那么,用户可点击待处理图片的表格区域。当电子设备接收到用户的点击操作时,电子设备可根据用户的点击操作所点击的位置确定目标区域为表格区域。在一些实施例中,电子设备可预先将表格区域、文本区域或图片区域中的一种或多种设置为预设区域。在调用预训练的图像语义分割模型将待处理图片划分为多个区域之后,电子设备可将多个区域中与预设区域匹配的区域确定为目标区域。例如,若预设区域包括表格区域和文本区域,多个区域包括表格区域、文本区域和图片区域,那么,目标区域可以为表格区域和文本区域。又例如,若预设区域为文本区域,多个区域包括表格区域、文本区域和图片区域,那么,目标区域可以为文本区域。在104中,对目标区域进行文字识别处理,以识别得到目标区域中的文字。例如,请继续参阅图3,若目标区域为文本区域A1,那么,电子设备可对该文本区域A1进行文字识别处理,以识别得到该文本区域A1中的文字。在识别得到目标区域中的文字之后,电子设备还可将目标区域中的文字输出。例如,电子设备可将文本区域A1中的文字保存为可编辑的形式,如word、TXT格式等。本申请实施例中,可调用预训练的图像语义分割模型将待处理图片划分为多个区域,从而在仅需要识别多个区域中的某一个区域的文字时,可以将该区域确定为目标区域;在需要识别出整个待处理图片中的文字时,可将该多个本文档来自技高网...

【技术保护点】
1.一种图片处理方法,其特征在于,包括:/n获取待处理图片;/n调用预训练的图像语义分割模型将所述待处理图片划分为多个区域,其中,每个区域对应一类别,所述类别包括文本类别、表格类别和图片类别;/n从所述多个区域中确定出目标区域;/n对所述目标区域进行文字识别处理,以识别得到所述目标区域中的文字。/n

【技术特征摘要】
1.一种图片处理方法,其特征在于,包括:
获取待处理图片;
调用预训练的图像语义分割模型将所述待处理图片划分为多个区域,其中,每个区域对应一类别,所述类别包括文本类别、表格类别和图片类别;
从所述多个区域中确定出目标区域;
对所述目标区域进行文字识别处理,以识别得到所述目标区域中的文字。


2.根据权利要求1所述的图片处理方法,其特征在于,所述获取待处理图片之前,还包括:
获取样本图片,所述样本图片包括多个样本区域,每个样本区域对应一类别;
获取待训练的图像语义分割模型;
利用所述样本图片对所述待训练的图像语义分割模型进行训练。


3.根据权利要求1所述的图片处理方法,其特征在于,所述目标区域包括表格区域,所述对所述目标区域进行文字识别处理,以识别得到所述目标区域中的文字之后,还包括:
识别所述表格区域中的表格的行数与列数;
根据所述行数与列数,生成表格;
将所述文字填充至所述表格中。


4.根据权利要求3所述的图片处理方法,其特征在于,所述目标区域还包括文本区域,所述将所述文字填充至所述表格中之后,还包括:
根据所述待处理图片的排版格式,对所述表格和从所述文本区域中识别出的文字进行排版;
输出排版后的表格和从所述文本区域中识别出的文字。


5.根据权利要求4所述的图片处理方法,其特征在于,所述输出排版后的表格和从所述文本区域中识别出的文字,包括:
显示编辑界面,所述编辑界面为供用户进行编辑操作的界面;
将排版后的表格和从所述文本区域中识别出的文字输出至所述编辑界面。


6.根据权利要求1所述的图片处理方法,其特征在于,所述对所述目标区域进行文...

【专利技术属性】
技术研发人员:刘鹏
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1