文本图像的排版方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36731859 阅读:13 留言:0更新日期:2023-03-04 09:59
本申请实施例公开一种文本图像的排版方法、装置、电子设备及存储介质,该方法包括:对第一文本图像进行文本行检测,确定所述第一文本图像中包含的各个文本图像块对应的行信息,其中,所述行信息包括行高、行首位置坐标及行尾位置坐标;根据所述第一文本图像中包含的各个文本图像块对应的行信息,对所述各个文本图像块进行匹配,生成至少一个文本行,以得到所述第一文本图像对应的行列表,其中,每个文本行中相邻两个文本图像块之间的匹配值满足阈值条件。能够提高对倾斜或弯曲的畸变文本图像的文本排版的准确度。的文本排版的准确度。的文本排版的准确度。

【技术实现步骤摘要】
文本图像的排版方法、装置、电子设备及存储介质


[0001]本申请涉及图文排版
,具体涉及一种文本图像的排版方法、装置、电子设备及存储介质。

技术介绍

[0002]文本排版能够提高用户的阅读体验。目前的文本排版方法主要是针对文本内容规整的文本图像,通过对文本图像进行图像分割得到包含文本行的多个子区域,按照各个子区域的图像坐标从上到下、从左到右进行排序。而在文本内容倾斜或弯曲的文本图像中,很难对各个文本行进行准确的排序。

技术实现思路

[0003]本申请实施例公开了一种文本图像的排版方法、装置、电子设备及存储介质,能够实现对文本内容倾斜或弯曲的畸变文本图像中的文本行进行准确排序。
[0004]本申请实施例第一方面公开了一种文本图像的排版方法,所述方法包括:
[0005]对第一文本图像分别进行文本行检测,确定所述第一文本图像中包含的各个文本图像块对应的行信息,其中,所述行信息包括行高、行首位置坐标及行尾位置坐标;
[0006]根据所述第一文本图像中包含的各个文本图像块对应的行信息,对所述各个文本图像块进行匹配,生成至少一个文本行,以得到所述第一文本图像对应的行列表,其中,每个文本行中相邻两个文本图像块之间的匹配值满足阈值条件。
[0007]作为一种可选的实施方式,在本申请实施例第一方面中,所述根据所述第一文本图像中包含的各个文本图像块对应的行信息,对所述各个文本图像块进行匹配,生成至少一个文本行,包括:
[0008]根据第一文本图像中包含的各个文本图像块对应的行信息,确定第一文本图像块与各个其他文本图像块之间的各个匹配值,其中,所述第一文本图像块为所述第一第一文本图像中的任一文本图像块,所述其他文本图像块为所述第一文本图像中除所述第一文本图像块以外的文本图像块;
[0009]确定所述各个匹配值中的最大匹配值,并将所述第一文本图像块加入所述最大匹配值对应的其他文本图像块,以生成至少一个文本行。
[0010]作为一种可选的实施方式,在本申请实施例第一方面中,在所述对所述第一文本图像进行文本行检测,确定所述第一文本图像中包含的各个文本图像块对应的行信息之后,还包括:
[0011]根据所述第一文本图像中包含的各个文本图像块的行首位置坐标的横坐标,按照横坐标从小到大的顺序,对所述各个文本图像块进行预排序,得到所述第一文本图像对应的图像块序列。
[0012]作为一种可选的实施方式,在本申请实施例第一方面中,所述根据所述第一文本图像中包含的各个文本图像块对应的行信息,对所述各个文本图像块进行匹配,生成至少
一个文本行,以得到所述第一文本图像对应的行列表,包括:
[0013]建立第一文本图像对应的行列表,并根据所述第一文本图像对应的第一图像块序列中排列在第一个的文本图像块,在所述行列表中创建一个新的文本行;
[0014]从所述第一图像块序列中确定当前文本图像块,将所述当前文本图像块的行信息与所述行列表中的各个文本行排在末尾的文本图像块的行信息进行匹配;
[0015]若所述当前文本图像块与目标文本行排在末尾的文本图像块匹配成功,则将所述当前文本图像块加入到所述目标文本行的末尾,以更新所述目标文本行排在末尾的文本图像块;
[0016]若所述当前文本图像块与所述各个文本行排在末尾的文本图像块均未匹配成功,则根据所述当前文本图像块在所述行列表中创建一个新的文本行;
[0017]将所述第一图像块序列中的下一文本图像块作为新的当前文本图像块,并继续执行所述将所述当前文本图像块的行信息与所述行列表中的各个文本行排在末尾的文本图像块的行信息进行匹配的步骤,直至所述当前文本图像块为所述第一图像块序列的最后一个文本图像块。
[0018]作为一种可选的实施方式,在本申请实施例第一方面中,所述从所述第一图像块序列中确定当前文本图像块,将所述当前文本图像块的行信息与所述行列表中的各个文本行排在末尾的文本图像块的行信息进行匹配,包括:
[0019]根据所述当前文本图像块的行信息及所述行列表中的第一文本行排在末尾的文本图像块的行信息,确定所述当前文本图像块与所述第一文本行排在末尾的文本图像块之间的匹配值,所述第一文本行为所述行列表中的任一文本行;
[0020]若所述匹配值大于匹配阈值,则所述当前文本图像块与所述第一文本行排在末尾的文本图像块匹配成功,并将所述第一文本行作为目标文本行;
[0021]若所述匹配值不大于所述匹配阈值,则所述当前文本图像块与所述第一文本行排在末尾的文本图像块未匹配成功。
[0022]作为一种可选的实施方式,在本申请实施例第一方面中,所述若所述当前文本图像块与目标文本行排在末尾的文本图像块匹配成功,则将所述当前文本图像块加入到所述目标文本行的末尾,以更新所述目标文本行排在末尾的文本图像块,包括:
[0023]若所述当前文本图像块仅与一个目标文本行排在末尾的文本图像块之间的匹配值满足阈值条件,则将所述当前文本图像块加入到所述目标文本行的末尾,以更新所述目标文本行排在末尾的文本图像块;
[0024]若所述当前文本图像块与至少两个目标文本行排在末尾的文本图像块之间的匹配值均满足阈值条件,则确定各个目标文本行排在末尾的文本图像块的匹配值中的最大匹配值,并将所述当前文本图像块加入到所述最大匹配值对应的目标文本行的末尾,以更新所述目标文本行排在末尾的文本图像块。
[0025]作为一种可选的实施方式,在本申请实施例第一方面中,所述从所述第一图像块序列中确定当前文本图像块,将所述当前文本图像块的行信息与所述行列表中的各个文本行排在末尾的文本图像块的行信息进行匹配,包括:
[0026]按照所述行列表中各个文本行的排列顺序,将所述当前文本图像块分别与各个文本行排在末尾的文本图像块的行信息依次进行匹配,其中,行列表中各个文本行依据所述
各个文本行的创建时间从先到后进行排列;
[0027]以及,所述若所述当前文本图像块与目标文本行排在末尾的文本图像块匹配成功,则将所述当前文本图像块加入到所述目标文本行的末尾,以更新所述目标文本行排在末尾的文本图像块,包括:
[0028]在检测到所述当前文本图像块与目标文本行排在末尾的文本图像块匹配成功时,将当前文本图像块加入到所述目标文本行的末尾,以更新所述目标文本行排在末尾的文本图像块,并停止继续对所述当前文本图像块进行匹配。
[0029]作为一种可选的实施方式,在本申请实施例第一方面中,在所述对第一文本图像进行文本行检测,确定所述第一文本图像中包含的各个文本图像块对应的行信息之前,还包括:
[0030]对全文本图像进行区域分割,得到至少一个第一文本图像,其中,所述第一文本图像为所述至少一个第一文本图像中的任一第一文本图像。
[0031]本申请实施例第二方面公开了一种文本图像的排版装置,所述装置包括:
[0032]文本检测模块,用于对第一文本图像进行文本行检测,确定所述第一文本图像中包含的各个文本图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本图像的排版方法,其特征在于,所述方法包括:对第一文本图像进行文本行检测,确定所述第一文本图像中包含的各个文本图像块对应的行信息,其中,所述行信息包括行高、行首位置坐标及行尾位置坐标;根据所述第一文本图像中包含的各个文本图像块对应的行信息,对所述各个文本图像块进行匹配,生成至少一个文本行,以得到所述第一文本图像对应的行列表,其中,每个文本行中相邻两个文本图像块之间的匹配值满足阈值条件。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一文本图像中包含的各个文本图像块对应的行信息,对所述各个文本图像块进行匹配,生成至少一个文本行,包括:根据第一文本图像中包含的各个文本图像块对应的行信息,确定第一文本图像块与各个其他文本图像块之间的各个匹配值,其中,所述第一文本图像块为所述第一文本图像中的任一文本图像块,所述其他文本图像块为所述第一第一文本图像中除所述第一文本图像块以外的文本图像块;确定所述各个匹配值中的最大匹配值,并将所述第一文本图像块加入所述最大匹配值对应的其他文本图像块,以生成至少一个文本行。3.根据权利要求1所述的方法,其特征在于,在所述对所述第一文本图像进行文本行检测,确定所述第一文本图像中包含的各个文本图像块对应的行信息之后,还包括:根据所述第一文本图像中包含的各个文本图像块的行首位置坐标的横坐标,按照横坐标从小到大的顺序,对所述各个文本图像块进行预排序,得到所述第一文本图像对应的图像块序列。4.根据权利要求3所述的方法,其特征在于,所述根据所述第一文本图像中包含的各个文本图像块对应的行信息,对所述各个文本图像块进行匹配,生成至少一个文本行,以得到所述第一文本图像对应的行列表,包括:建立第一文本图像对应的行列表,并根据所述第一文本图像对应的第一图像块序列中排列在第一个的文本图像块,在所述行列表中创建一个新的文本行;从所述第一图像块序列中确定当前文本图像块,将所述当前文本图像块的行信息与所述行列表中的各个文本行排在末尾的文本图像块的行信息进行匹配;若所述当前文本图像块与目标文本行排在末尾的文本图像块匹配成功,则将所述当前文本图像块加入到所述目标文本行的末尾,以更新所述目标文本行排在末尾的文本图像块;若所述当前文本图像块与所述各个文本行排在末尾的文本图像块均未匹配成功,则根据所述当前文本图像块在所述行列表中创建一个新的文本行;将所述第一图像块序列中的下一文本图像块作为新的当前文本图像块,并继续执行所述将所述当前文本图像块的行信息与所述行列表中的各个文本行排在末尾的文本图像块的行信息进行匹配的步骤,直至所述当前文本图像块为所述第一图像块序列的最后一个文本图像块。5.根据权利要求4所述的方法,其特征在于,所述从所述第一图像块序列中确定当前文本图像块,将所述当前文本图像块的行信息与所述行列表中的各个文本行排在末尾的文本图像块的行信息进行匹配,包括:根据所述当前文本图像块的行信息及所述行列表中的第一文本行排在末尾的文本图
像块的行信息,确定所述当前文本图像块与所述第一文本行排在末尾的文本图像块之间的匹配值,所述第一文本行为所述行列表中的任一文本行;若所述匹配值...

【专利技术属性】
技术研发人员:华杰
申请(专利权)人:广东艾檬电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1