图像文本显示方法、装置、存储介质及终端制造方法及图纸

技术编号:24576417 阅读:52 留言:0更新日期:2020-06-21 00:26
本申请实施例公开了一种图像文本显示方法、装置、存储介质及终端,其中,方法包括:获取待识别图像包含的至少一个文本区域中目标文本区域内的文本;提取所述文本对应的至少一个语意特征;基于所述至少一个语意特征对所述文本进行排版,得到目标排版文本;生成并显示包含所述目标排版文本的最终排版文本,所述最终排版文本包括所述至少一个文本区域中各文本区域对应的排版文本。本申请实施例基于语意特征对文本进行自动调整,调整后的文本更接近于真实需求;文本排版全程无需用户手动参与,增加了排版的智能性;所述方法可用于不同类型的图像文本中,适用性强。

Image text display method, device, storage medium and terminal

【技术实现步骤摘要】
图像文本显示方法、装置、存储介质及终端
本申请涉及计算机
,尤其涉及一种图像文本显示方法、装置、存储介质及终端。
技术介绍
光学字符识别(OpticalCharacterRecognition,OCR)是指对文本资料进行扫描后,对图像文件进行分析处理获取文字及版面信息的过程,借助于OCR技术,图像中的文本内容可被轻松提取出来。在利用OCR技术识别出图像中的文字后,一般都是根据图像文本原先的排版方式直接输出文档,而所输出的文档排版并不一定是用户所需要的,根据需要,还需用户手动对文档排版适应性调整,这种排版方式会给用户带来额外的工作量,从而降低了排版的智能性。
技术实现思路
本申请实施例提供了一种图像文本显示方法、装置、存储介质及终端,可以解决上述排版方式给用户带来了额外的工作量、降低了排版的智能性的问题。所述技术方案如下:第一方面,本申请实施例提供了一种图像文本显示方法,所述方法包括:获取待识别图像包含的至少一个文本区域中目标文本区域内的文本;提取所述文本对应的至少一个语意特征;基于所述至少一个语意特征对所述文本进行排版,得到目标排版文本;生成并显示包含所述目标排版文本的最终排版文本,所述最终排版文本包括所述至少一个文本区域中各文本区域对应的排版文本。第二方面,本申请实施例提供了一种图像文本显示装置,所述装置包括:文本获取模块,用于获取待识别图像包含的至少一个文本区域中目标文本区域内的文本;语意特征提取模块,用于提取所述文本对应的至少一个语意特征;文本排版模块,用于基于所述至少一个语意特征对所述文本进行排版,得到目标排版文本;排版文本显示模块,用于生成并显示包含所述目标排版文本的最终排版文本,所述最终排版文本包括所述至少一个文本区域中各文本区域对应的排版文本。第三方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项方法的步骤。第四方面,本申请实施例提供了一种终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一项方法的步骤。本申请一些实施例提供的技术方案带来的有益效果至少包括:本申请实施例提供的图像文本显示方法,先获取待识别图像包含的至少一个文本区域中目标文本区域内的文本并提取所述文本对应的至少一个语意特征,再基于所述至少一个语意特征对所述文本进行排版,得到目标排版文本,最后生成并显示包含所述目标排版文本的最终排版文本,所述最终排版文本包括所述至少一个文本区域中各文本区域对应的排版文本。所述方法在识别出待识别图像中的文本后,还要获取文本的语意特征,根据文本的语意特征对文本进行重新排版,并在待识别图像所有文本区域的文本均重新排版之后生成最终排版文本显示给用户,基于语意特征对文本进行自动调整,调整后的文本更接近于真实需求;文本排版全程无需用户手动参与,增加了排版的智能性;本申请提供的所述方法可用于不同类型的图像文本中,方法适用性强。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的一种图像文本显示方法的流程示意图;图2是本申请实施例提供的某一演示文稿页中的文本区域示意图;图3a-3c是本申请实施例提供的一种图像文本排版的过程示意图;图4是本申请实施例提供的一种图像文本显示方法的流程示意图;图5a-5c是本申请实施例提供的一种段落划分示意图;图6是本申请实施例提供的一种图像文本显示方法的流程示意图;图7是本申请实施例提供的一张图片文本区域示意图;图8是本申请实施例提供的一种图像文本显示装置的结构示意图;图9是本申请实施例提供的一种图像文本显示装置的结构示意图;图10是本申请实施例提供的一种图像文本显示装置的结构示意图;图11是本申请实施例提供的一种终端结构框图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施例方式作进一步地详细描述。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。在本申请的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。此外,在本申请的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。下面将结合附图1-附图7,对本申请实施例提供的图像文本显示方法进行详细介绍。请参见图1,为本申请实施例提供的一种图像文本显示方法的流程示意图。如图1所示,本申请实施例的所述方法可以包括以下步骤:S101,获取待识别图像包含的至少一个文本区域中目标文本区域内的文本,提取所述文本对应的至少一个语意特征。本实施例中的待识别图像包含文本内容,可以是演示文稿(PowerPoint,PPT)中的某页,PDF文件或者相册中的某张图片等。根据文本的集中度或排版方式,所述待识别图像可以划分为一个或多个文本区域,每个文本区域均包含有部分文本,各部分文本可以是几个字/词、一句话或者一个段落等。图像中的文本采用OCR技术识别。图2示出了一页演示文稿,如图所示,本页演示文稿包含两个文本区域,即图示第一文本区域与第二文本区域,第一文本区域与第二文本区域中的文本内容共同构成了该页演示文稿的全部内容。将示意图中的第二文本区域作为目标文本区域,利用BERT模型(BidirectionalEncoderRepresentationfromTransformers)对该区域中的文本进行语意特征提取。语意特征是对文本的简练概括,它能表达出文本所包含的意义。语意特征的提取可以针对目标文本区域中的全部内容,也可以针对目标文本区域中的局部内容。对于不同文本,语意特征可以提取出一个或多个。例如针对图2中的第二文本区域,语意特征的提取结果为几何元素在设计中的作用与效果。特别说明的是,本实施例中的目标文本区域指的是一个文本区域,在其他可行的实施例中,所述目标文本区域也可以是多个文本区域。S102,基于所述至少一个语意特征对所述文本进行排版,得到目标排版文本。根据文本的本文档来自技高网...

【技术保护点】
1.一种图像文本显示方法,其特征在于,所述方法包括:/n获取待识别图像包含的至少一个文本区域中目标文本区域内的文本;/n提取所述文本对应的至少一个语意特征;/n基于所述至少一个语意特征对所述文本进行排版,得到目标排版文本;/n生成并显示包含所述目标排版文本的最终排版文本,所述最终排版文本包括所述至少一个文本区域中各文本区域对应的排版文本。/n

【技术特征摘要】
1.一种图像文本显示方法,其特征在于,所述方法包括:
获取待识别图像包含的至少一个文本区域中目标文本区域内的文本;
提取所述文本对应的至少一个语意特征;
基于所述至少一个语意特征对所述文本进行排版,得到目标排版文本;
生成并显示包含所述目标排版文本的最终排版文本,所述最终排版文本包括所述至少一个文本区域中各文本区域对应的排版文本。


2.根据权利要求1所述的方法,其特征在于,所述提取所述文本对应的至少一个语意特征,包括:
逐行遍历所述文本对应的语句集合,分别提取所述语句集合中各语句的语意特征。


3.根据权利要求2所述的方法,其特征在于,所述基于所述至少一个语意特征对所述文本进行排版,得到目标排版文本,包括:
基于所述各语句的语意特征对所述语句集合进行分段,生成所述文本对应的第一段落集合;
对所述第一段落集合进行排版,得到目标排版文本。


4.根据权利要求3所述的方法,其特征在于,所述基于所述各语句的语意特征对所述语句集合进行分段,生成所述文本对应的第一段落集合,包括:
基于所述各语句的语意特征,确定所述各语句中相邻语句的连贯性;
当所述相邻语句的连贯性为连贯时,将所述相邻语句分为同一段落;
当所述相邻语句的连贯性为不连贯时,将所述相邻语句分为不同段落;
生成所述语句集合对应的第一段落集合。


5.根据权利要求3所述的方法,其特征在于,所述对所述第一段落集合进行排版,得到目标排版文本,包括:
获取所述第一段落集合中包含预设类型标识的第二段落集合;
基于所述预设类型标识对所述第二段落集合中各第二段落进行分段,生成所述各第二段落分别对应的目标段落集合;
对所述目标段落集合以及所述第一段落集合中除所述第二段落集合以外的第三段落集合进行排版,得到目标排版文本。


6.根据权利要求5所述的方法,其特征在于,所述对所述目标段落集合以及所述第一段落中除所述第二段落集合以外的第三段落集合进行排版,得到目标排版文本,包括:
对在所述目标段落集合以及所述第一段落...

【专利技术属性】
技术研发人员:宋肃
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1