【技术实现步骤摘要】
图像文本显示方法、装置、存储介质及终端
本申请涉及计算机
,尤其涉及一种图像文本显示方法、装置、存储介质及终端。
技术介绍
光学字符识别(OpticalCharacterRecognition,OCR)是指对文本资料进行扫描后,对图像文件进行分析处理获取文字及版面信息的过程,借助于OCR技术,图像中的文本内容可被轻松提取出来。在利用OCR技术识别出图像中的文字后,一般都是根据图像文本原先的排版方式直接输出文档,而所输出的文档排版并不一定是用户所需要的,根据需要,还需用户手动对文档排版适应性调整,这种排版方式会给用户带来额外的工作量,从而降低了排版的智能性。
技术实现思路
本申请实施例提供了一种图像文本显示方法、装置、存储介质及终端,可以解决上述排版方式给用户带来了额外的工作量、降低了排版的智能性的问题。所述技术方案如下:第一方面,本申请实施例提供了一种图像文本显示方法,所述方法包括:获取待识别图像包含的至少一个文本区域中目标文本区域内的文本;提取所述文本对应的 ...
【技术保护点】
1.一种图像文本显示方法,其特征在于,所述方法包括:/n获取待识别图像包含的至少一个文本区域中目标文本区域内的文本;/n提取所述文本对应的至少一个语意特征;/n基于所述至少一个语意特征对所述文本进行排版,得到目标排版文本;/n生成并显示包含所述目标排版文本的最终排版文本,所述最终排版文本包括所述至少一个文本区域中各文本区域对应的排版文本。/n
【技术特征摘要】
1.一种图像文本显示方法,其特征在于,所述方法包括:
获取待识别图像包含的至少一个文本区域中目标文本区域内的文本;
提取所述文本对应的至少一个语意特征;
基于所述至少一个语意特征对所述文本进行排版,得到目标排版文本;
生成并显示包含所述目标排版文本的最终排版文本,所述最终排版文本包括所述至少一个文本区域中各文本区域对应的排版文本。
2.根据权利要求1所述的方法,其特征在于,所述提取所述文本对应的至少一个语意特征,包括:
逐行遍历所述文本对应的语句集合,分别提取所述语句集合中各语句的语意特征。
3.根据权利要求2所述的方法,其特征在于,所述基于所述至少一个语意特征对所述文本进行排版,得到目标排版文本,包括:
基于所述各语句的语意特征对所述语句集合进行分段,生成所述文本对应的第一段落集合;
对所述第一段落集合进行排版,得到目标排版文本。
4.根据权利要求3所述的方法,其特征在于,所述基于所述各语句的语意特征对所述语句集合进行分段,生成所述文本对应的第一段落集合,包括:
基于所述各语句的语意特征,确定所述各语句中相邻语句的连贯性;
当所述相邻语句的连贯性为连贯时,将所述相邻语句分为同一段落;
当所述相邻语句的连贯性为不连贯时,将所述相邻语句分为不同段落;
生成所述语句集合对应的第一段落集合。
5.根据权利要求3所述的方法,其特征在于,所述对所述第一段落集合进行排版,得到目标排版文本,包括:
获取所述第一段落集合中包含预设类型标识的第二段落集合;
基于所述预设类型标识对所述第二段落集合中各第二段落进行分段,生成所述各第二段落分别对应的目标段落集合;
对所述目标段落集合以及所述第一段落集合中除所述第二段落集合以外的第三段落集合进行排版,得到目标排版文本。
6.根据权利要求5所述的方法,其特征在于,所述对所述目标段落集合以及所述第一段落中除所述第二段落集合以外的第三段落集合进行排版,得到目标排版文本,包括:
对在所述目标段落集合以及所述第一段落...
【专利技术属性】
技术研发人员:宋肃,
申请(专利权)人:OPPO广东移动通信有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。