本申请公开了一种文件转换方法、装置、存储介质及电子设备。该方法包括:获取原始图片;从该原始图片中提取其所具有的预设类型的内容,并确定各该内容所在的位置,该预设类型至少包括预设的文字类型、插图类型以及表格类型;对各该内容所在位置的像素进行擦除,并在擦除处理后对各该内容所在位置的像素进行补绘,以得到该原始图片的背景图;将提取到的各该内容按照其在该原始图片中的位置排版到该背景图上,得到内容可编辑的文件。本申请可以提高文件信息转换的完整性。
【技术实现步骤摘要】
文件转换方法、装置、存储介质及电子设备
本申请属于文件处理
,尤其涉及一种文件转换方法、装置、存储介质及电子设备。
技术介绍
用户经常需要处理各种格式的文件。在一些场景下,用户需要将某种格式的文件转换为另一种格式的文件。例如,在某些使用场景下,用户需要利用电子设备将图片中的文字转换为可编辑的文档,从而方便处理,等等。然而,相关技术中,在将图片格式的文件转换为可编辑的文档时,文件信息转换的完整性较差。
技术实现思路
本申请实施例提供一种文件转换方法、装置、存储介质及电子设备,可以提高文件信息转换的完整性。第一方面,本申请实施例提供一种文件转换方法,包括:获取原始图片;从所述原始图片中提取其所具有的预设类型的内容,并确定各所述内容所在的位置,所述预设类型至少包括预设的文字类型、插图类型以及表格类型;对各所述内容所在位置的像素进行擦除,并在擦除处理后对各所述内容所在位置的像素进行补绘,以得到所述原始图片的背景图;将提取到的各所述内容按照其在所述原始图片中的位置排版到所述背景图上,得到内容可编辑的文件。第二方面,本申请实施例提供一种文件转换装置,包括:获取模块,用于获取原始图片;确定模块,用于从所述原始图片中提取其所具有的预设类型的内容,并确定各所述内容所在的位置,所述预设类型至少包括预设的文字类型、插图类型以及表格类型;第一处理模块,用于对各所述内容所在位置的像素进行擦除,并在擦除处理后对各所述内容所在位置的像素进行补绘,以得到所述原始图片的背景图;第二处理模块,用于将提取到的各所述内容按照其在所述原始图片中的位置排版到所述背景图上,得到内容可编辑的文件。第三方方面,本申请实施例提供一种计算机可读的存储介质,其上存储有计算机程序,当所述计算机程序在计算机上执行时,使得所述计算机执行本申请实施例提供的文件转换方法中的流程。第四方面,本申请实施例还提供一种电子设备,包括存储器,处理器,所述处理器通过调用所述存储器中存储的计算机程序,用于执行本申请实施例提供的文件转换方法中的流程。本申请实施例中,电子设备可以先从原始图片中提取其所具有的预设类型的内容,从而使这些内容变为可编辑的格式,再通过对原始图片中的这些内容所在位置的像素进行擦除和补绘处理,从而得到对应的背景图。之后,电子设备可以将提取到的内容按照其在原始图片中的位置排版到该背景图上,从而得到内容可编辑的文件。由于在文件转换过程中,背景得到了保留,并且插图也能够识别并保留出来,因此提高了文件信息转换的完整性。附图说明下面结合附图,通过对本申请的具体实施方式详细描述,将使本申请的技术方案及其有益效果显而易见。图1是本申请实施例提供的文件转换方法的第一种流程示意图。图2至图5为本申请实施例提供的文件转换方法的场景示意图。图6是本申请实施例提供的文件转换方法的第二种流程示意图。图7是本申请实施例提供的文件转换方法的第三种流程示意图。图8是本申请实施例提供的文件转换装置的结构示意图。图9是本申请实施例提供的电子设备的结构示意图。图10是本申请实施例提供的电子设备的另一结构示意图。具体实施方式请参照图示,其中相同的组件符号代表相同的组件,本申请的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本申请具体实施例,其不应被视为限制本申请未在此详述的其它具体实施例。可以理解的是,本申请实施例的执行主体可以是诸如智能手机或平板电脑等的电子设备。请参阅图1,图1是本申请实施例提供的文件转换方法的第一种流程示意图,流程可以包括:101、获取原始图片。用户经常需要处理各种格式的文件。在一些场景下,用户需要将某种格式的文件转换为另一种格式的文件。例如,在某些使用场景下,用户需要利用电子设备将图片中的文字转换为可编辑的文档,从而方便处理,等等。然而,相关技术中,在将图片格式的文件转换为可编辑的文档时,文件信息转换的完整性较差。例如,在文件转换过程中,原图片中的背景图案无法得到保留,或者无法识别出原图片中的插图等。在本申请实施例中,比如,电子设备可以先获取一张图片,并将该图片确定为原始图片。例如,如图2所示,该原始图片可以是一张名片的照片,在该名片上有用户的姓名、电话、地址等文字信息,还有该用户所在公司的LOGO标识,其中该LOGO标识可以是以插图的形式印制在该名片上的。可以理解的是,由于该原始图片是一张照片,因此电子设备无法对其中的文字内容以及插图进行单独的操作,即这些文字内容和插图是不可编辑的。102、从原始图片中提取其所具有的预设类型的内容,并确定各内容所在的位置,该预设类型至少包括预设的文字类型、插图类型以及表格类型。比如,在获取到原始图片后,电子设备可以从该原始图片中提取其所具有的预设类型的内容,并确定出各个内容在该原始图片中所在的位置。其中,预设类型的内容至少可以包括预设的文字类型、插图类型以及表格类型等。例如,原始图片中包含文字和插图这两种类型的内容,那么电子设备可以从该原始图片中提取其所具有的文字和插图。并且,电子设备可以确定出各文字和各插图在该原始图片中的位置。例如,如图3所示,电子设备从原始图片中提取了文字内容“张三”、“电话:123456789”以及“地址:深圳市南山区”(提取出的文字内容变为了可编辑的内容)。并且,电子设备从原始图片中提取了关于用户公司LOGO的插图。此外,电子设备还确定出文字内容所在的位置A以及插图内容所在的位置B。又如,若原始图片中包含文字、插图和表格这三种类型的内容,那么电子设备可以从该原始图片中提取其所具有的文字、插图和表格。并且,电子设备可以确定出各文字、各插图以及各表格在该原始图片中的位置。103、对各内容所在位置的像素进行擦除,并在擦除处理后对各内容所在位置的像素进行补绘,以得到原始图片的背景图。比如,在确定出各内容所在的位置后,电子设备可以对各内容所在位置的像素进行擦除处理,并在该擦除处理完成后对各内容所在位置的像素进行补绘,从而可以得到原始图片的背景图。需要说明的是,擦除像素可以是指将像素的数据信息删除,从而使得被擦除像素的位置没有像素值信息。同样需要说明的是,补绘可以是指使用坏点像素周围的像素来取代坏点像素。例如,在对某个位置的像素进行擦除后(被擦除像素的位置可以认为是坏点像素),电子设备可以利用该位置的周围像素的像素值来对该位置进行填充,从而实现对该位置的像素的补绘。例如,如图4所示,电子设备可以将A位置和B位置所在的区域的像素擦除,并根据A位置区域周边的像素对A位置区域的像素进行补绘,以及根据B位置区域周边的像素对B位置区域的像素进行补绘,从而得到一张关于原始图片的背景图。104、将提取到的各内容按照其在原始图片中的位置排版到背景图上,得到内容可编辑的文件。比如,在得到原始图片的背景图后,电本文档来自技高网...
【技术保护点】
1.一种文件转换方法,其特征在于,包括:/n获取原始图片;/n从所述原始图片中提取其所具有的预设类型的内容,并确定各所述内容所在的位置,所述预设类型至少包括预设的文字类型、插图类型以及表格类型;/n对各所述内容所在位置的像素进行擦除,并在擦除处理后对各所述内容所在位置的像素进行补绘,以得到所述原始图片的背景图;/n将提取到的各所述内容按照其在所述原始图片中的位置排版到所述背景图上,得到内容可编辑的文件。/n
【技术特征摘要】
1.一种文件转换方法,其特征在于,包括:
获取原始图片;
从所述原始图片中提取其所具有的预设类型的内容,并确定各所述内容所在的位置,所述预设类型至少包括预设的文字类型、插图类型以及表格类型;
对各所述内容所在位置的像素进行擦除,并在擦除处理后对各所述内容所在位置的像素进行补绘,以得到所述原始图片的背景图;
将提取到的各所述内容按照其在所述原始图片中的位置排版到所述背景图上,得到内容可编辑的文件。
2.根据权利要求1所述的文件转换方法,其特征在于,所述从所述原始图片中提取其所具有的预设类型的内容,并确定各所述内容所在的位置,包括:
当所述原始图片中包含文字类型的内容时,使用光学字符识别的方式来提取所述原始图片所具有的文字类型的内容,以及确定各所述文字类型的内容所在的位置。
3.根据权利要求1所述的文件转换方法,其特征在于,所述从所述原始图片中提取其所具有的预设类型的内容,并确定各所述内容所在的位置,包括:
当所述原始图片中包含插图类型的内容时,使用预设的基于卷积神经网络的检测模型来提取所述原始图片中包含的插图类型的内容,以及确定各所述插图类型的内容所在的位置。
4.根据权利要求1所述的文件转换方法,其特征在于,所述在擦除处理后对各所述内容所在位置的像素进行补绘,包括:
在擦除处理后,使用基于快速行进算法FMM的算法对各所述内容所在位置的像素进行补绘。
5.根据权利要求1所述的文件转换方法,其特征在于,所述在擦除处理后对各所述内容所在位置的像素进行补绘,包括:
在擦除处理后,使用基于生成对抗网络GAN的算法对各所述内容所在位置的像素进行补绘。
6.根据权利要求4所述的文件转换方法...
【专利技术属性】
技术研发人员:郭子亮,
申请(专利权)人:OPPO重庆智能科技有限公司,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。