一种图片处理的方法、相关装置、设备以及存储介质制造方法及图纸

技术编号:35061538 阅读:19 留言:0更新日期:2022-09-28 11:15
本申请公开了一种图片处理的方法,应用场景至少包括各类终端,如:手机、电脑、车载终端等。本申请提供的方法包括:获取待处理的原始图片;对原始图片进行内容识别,得到原始图片的图片类型;若原始图片的图片类型满足格式转换条件,则生成原始图片所对应的结构体文件,结构体文件包括至少一个文本信息,且,至少一个文本信息为基于原始图片识别到的文本内容;存储结构体文件,结构体文件用于生成目标图片。本申请还提供了相关装置、设备以及存储介质。本申请基于原始图片生成并存储结构体文件,相比于原始图片而言,结构体文件所占的存储空间较小,从而能够有效地缓解图片占用存储空间过多的问题。空间过多的问题。空间过多的问题。

【技术实现步骤摘要】
一种图片处理的方法、相关装置、设备以及存储介质


[0001]本申请涉及计算机视觉
,尤其涉及一种图片处理的方法、相关装置、设备以及存储介质。

技术介绍

[0002]如今,社交通讯类应用成为用户必不可少的日常使用软件。用户可通过手机或者电脑等终端设备进行大量的社交互动,也产生了大量的消息。其中很大一部分消息为图片,而随着大量图片的堆砌,给终端设备的存储空间带来了较大的存储压力。
[0003]目前,在终端设备存储空间不够时,用户可以选定一部分图片进行删除。这些图片中可能包含大量以文字为主体内容的图片,因此,用户在选择删除时通常需要预览整个文字内容之后,再进行选择性地删除。
[0004]专利技术人发现现有方案中至少存在如下问题,然而,尽管直接删除图片能够释放出一定的存储空间,但是删除的过程费时费力,而且还可能会删除重要的信息。因此,如何优化大量图片的存储,避免占用较大的存储空间,是一个亟待解决的问题。

技术实现思路

[0005]本申请实施例提供了一种图片处理的方法、相关装置、设备以及存储介质。本申请基于原始图片生成并存储结构体文件,相比于原始图片而言,结构体文件所占的存储空间较小,从而能够有效地缓解图片占用存储空间过多的问题。
[0006]有鉴于此,本申请一方面提供一种图片处理的方法,包括:
[0007]获取待处理的原始图片;
[0008]对原始图片进行内容识别,得到原始图片的图片类型;
[0009]若原始图片的图片类型满足格式转换条件,则生成原始图片所对应的结构体文件,其中,结构体文件包括至少一个文本信息,且,至少一个文本信息为基于原始图片识别到的文本内容;
[0010]存储结构体文件,其中,结构体文件用于生成目标图片。
[0011]本申请另一方面提供一种图片处理装置,包括:
[0012]获取模块,用于获取待处理的原始图片;
[0013]获取模块,还用于对原始图片进行内容识别,得到原始图片的图片类型;
[0014]生成模块,用于若原始图片的图片类型满足格式转换条件,则生成原始图片所对应的结构体文件,其中,结构体文件包括至少一个文本信息,且,至少一个文本信息为基于原始图片识别到的文本内容;
[0015]存储模块,用于存储结构体文件,其中,结构体文件用于生成目标图片。
[0016]在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
[0017]获取模块,具体用于调用目标检测模型对原始图片进行内容识别,得到图片识别结果;
[0018]若图片识别结果指示原始图片包括T个文本区域,则确定T个文本区域在原始图片的占比,其中,T为大于或等于1的整数;
[0019]若T个文本区域在原始图片的占比大于或等于第一占比阈值,则确定原始图片的图片类型为文字图片类型,其中,文字图片类型满足格式转换条件。
[0020]在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
[0021]生成模块,具体用于针对T个文本区域中的每个文本区域,对文本区域进行光学字符识别OCR处理,得到文本区域所对应的文本信息;
[0022]根据T个文本区域中每个文本区域所对应的文本信息,生成原始图片所对应的结构体文件。
[0023]在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,结构体文件包括预设字段集合,且,预设字段集合包括内容字段;
[0024]生成模块,具体用于根据T个文本区域中每个文本区域所对应的文本信息,确定内容字段所对应的文本信息;
[0025]若预设字段集合还包括区域位置字段,则根据T个文本区域,确定区域位置字段所对应的区域位置信息;
[0026]若预设字段集合还包括字体尺寸字段,则根据T个文本区域中每个文本区域所对应的文本信息,确定字体尺寸字段所对应的字体尺寸信息;
[0027]若预设字段集合还包括区域宽度字段,则根据T个文本区域,确定区域宽度字段所对应的区域宽度信息;
[0028]若预设字段集合还包括字体颜色字段,则根据T个文本区域中每个文本区域所对应的文本信息,确定字体颜色字段所对应的字体颜色信息;
[0029]若预设字段集合还包括字体粗体字段,则根据T个文本区域中每个文本区域所对应的文本信息,确定字体粗体字段所对应的字体粗体信息;
[0030]若预设字段集合还包括字体斜体字段,则根据T个文本区域中每个文本区域所对应的文本信息,确定字体斜体字段所对应的字体斜体信息;
[0031]若预设字段集合还包括字体类型字段,则根据T个文本区域中每个文本区域所对应的文本信息,确定字体类型字段所对应的字体类型信息;
[0032]若预设字段集合还包括图片类型字段,则确定图片类型字段所对应的文字图片类型;
[0033]根据文本信息,以及,根据区域位置信息、字体尺寸信息、区域宽度信息、字体颜色信息、字体粗体信息、字体斜体信息、字体类型信息与文字图片类型中的至少一种,生成原始图片所对应的结构体文件。
[0034]在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,图片处理装置还包括处理模块;
[0035]获取模块,还用于获取目标结构体文件;
[0036]处理模块,用于若目标结构体文件包括文字图片类型,则根据目标结构体文件进行渲染处理,得到第一目标图片,其中,第一目标图片显示有至少一个文本段。
[0037]在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
[0038]获取模块,具体用于采用第一模板图片对原始图片进行内容匹配,得到内容匹配
结果;
[0039]若内容匹配结果指示匹配成功,则确定原始图片的图片类型为会话图片类型,其中,会话图片类型满足格式转换条件。
[0040]在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
[0041]生成模块,具体用于对原始图片进行光学字符识别OCR处理,得到M个文本信息,其中,M为大于或等于1的整数;
[0042]采用第二模板图片对原始图片进行内容匹配,得到N个会话区域,其中,每个会话区域包括一个文本信息,N为大于或等于1的整数;
[0043]根据N个会话区域,获取每个会话区域所对应的头像;
[0044]根据M个文本信息以及每个会话区域所对应的头像,生成原始图片所对应的结构体文件。
[0045]在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
[0046]生成模块,具体用于针对N个会话区域中的每个会话区域,根据预设偏移量获取会话区域对应的头像;
[0047]处理模块,还用于对每个会话区域对应的头像进行哈希计算,得到每个头像的待匹配哈希信息;
[0048]处理模块,还用于若头像的待匹配哈希信息与终端设备本地存储的头像哈希信息匹配成功,则将头像的待匹配哈希信息作为头像的头像哈希信息;
[004本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图片处理的方法,其特征在于,包括:获取待处理的原始图片;对所述原始图片进行内容识别,得到所述原始图片的图片类型;若所述原始图片的图片类型满足格式转换条件,则生成所述原始图片所对应的结构体文件,其中,所述结构体文件包括至少一个文本信息,且,所述至少一个文本信息为基于所述原始图片识别到的文本内容;存储所述结构体文件,其中,所述结构体文件用于生成目标图片。2.根据权利要求1所述的方法,其特征在于,所述对所述原始图片进行内容识别,得到所述原始图片的图片类型,包括:调用目标检测模型对所述原始图片进行内容识别,得到图片识别结果;若所述图片识别结果指示所述原始图片包括T个文本区域,则确定所述T个文本区域在所述原始图片的占比,其中,所述T为大于或等于1的整数;若所述T个文本区域在所述原始图片的占比大于或等于第一占比阈值,则确定所述原始图片的图片类型为文字图片类型,其中,所述文字图片类型满足所述格式转换条件。3.根据权利要求2所述的方法,其特征在于,所述生成所述原始图片所对应的结构体文件,包括:针对所述T个文本区域中的每个文本区域,对文本区域进行光学字符识别OCR处理,得到文本区域所对应的文本信息;根据所述T个文本区域中每个文本区域所对应的文本信息,生成所述原始图片所对应的所述结构体文件。4.根据权利要求3所述的方法,其特征在于,所述结构体文件包括预设字段集合,且,所述预设字段集合包括内容字段;所述根据所述T个文本区域中每个文本区域所对应的文本信息,生成所述原始图片所对应的所述结构体文件,包括:根据所述T个文本区域中每个文本区域所对应的文本信息,确定所述内容字段所对应的文本信息;若所述预设字段集合还包括区域位置字段,则根据所述T个文本区域,确定所述区域位置字段所对应的区域位置信息;若所述预设字段集合还包括字体尺寸字段,则根据所述T个文本区域中每个文本区域所对应的文本信息,确定所述字体尺寸字段所对应的字体尺寸信息;若所述预设字段集合还包括区域宽度字段,则根据所述T个文本区域,确定所述区域宽度字段所对应的区域宽度信息;若所述预设字段集合还包括字体颜色字段,则根据所述T个文本区域中每个文本区域所对应的文本信息,确定所述字体颜色字段所对应的字体颜色信息;若所述预设字段集合还包括字体粗体字段,则根据所述T个文本区域中每个文本区域所对应的文本信息,确定所述字体粗体字段所对应的字体粗体信息;若所述预设字段集合还包括字体斜体字段,则根据所述T个文本区域中每个文本区域所对应的文本信息,确定所述字体斜体字段所对应的字体斜体信息;若所述预设字段集合还包括字体类型字段,则根据所述T个文本区域中每个文本区域
所对应的文本信息,确定所述字体类型字段所对应的字体类型信息;若所述预设字段集合还包括图片类型字段,则确定所述图片类型字段所对应的所述文字图片类型;根据所述文本信息,以及,根据所述区域位置信息、所述字体尺寸信息、所述区域宽度信息、所述字体颜色信息、所述字体粗体信息、所述字体斜体信息、所述字体类型信息与所述文字图片类型中的至少一种,生成所述原始图片所对应的所述结构体文件。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取目标结构体文件;若所述目标结构体文件包括文字图片类型,则根据所述目标结构体文件进行渲染处理,得到第一目标图片,其中,所述第一目标图片显示有至少一个文本段。6.根据权利要求1所述的方法,其特征在于,所述对所述原始图片进行内容识别,得到所述原始图片的图片类型,包括:采用第一模板图片对所述原始图片进行内容匹配,得到内容匹配结果;若所述内容匹配结果指示匹配成功,则确定所述原始图片的图片类型为会话图片类型,其中,所述会话图片类型满足所述格式转换条件。7.根据权利要求6所述的方法,其特征在于,所述生成所述原始图片所对应的结构体文件,包括:对所述原始图片进行光学字符识别OCR处理,得到M个文本信息,其中,所述M为大于或等于1的整数;采用第二模板图片对所述原始图片进行内容匹配,得到N个会话区域,其中,每个会话区域包括一个文本信息,所述N为大于或等于1的整数;根据所述N个会话区域,获取所述每个会话区域所对应的头像;根据所述M个文本信息以及所述每个会话区域所对应的头像,生成所述原始图片所对应的所述结构体文件。8.根据权利要求7所述的方法,其特征在于,所述根据所述N个会话区域,获取所述每个会话区域所对应的头像,包括:针对所述N个会话区域中的每个会话区域,根据预设偏移量获取会话区域对应的头像;所述方法还包括:对所述每个会话区域对应的头像进行哈希计算,得到每个头像的待匹配哈希信息;若头像的待匹配哈希信息与终端设备本地存储的头像哈希信息匹配成功,则将所述头像的待匹配哈希信息作为所述头像的头像哈希信息;若头像的待匹配哈希信息与终端设备本地存储的头像哈希信息匹配失败,则存储所述头像,并将所述头像的待匹配哈希信息作为所述头像的头像哈希信息。9.根据权利要求7或8所述的方法,其特征在于,所述结构体文件包括预设字段集合,且,所述预设字段集合包括消息字段以及头像字段;所述根据所述M个文本信...

【专利技术属性】
技术研发人员:余自强
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1