一种文档识别和显示方法及其移动终端技术

技术编号:15690845 阅读:154 留言:0更新日期:2017-06-24 03:34
本发明专利技术公开一种文档识别和显示方法及其移动终端,涉及电子文档排版及显示领域。该方法包括识别电子文档和显示电子文档,其中识别电子文档包括:移动终端获取电子文档的图像数据;将图像数据中的文字数据和图片数据进行分离;将图像数据发送至多个处理器,分别进行文字数据、图片数据、格式数据以及定位数据的处理;根据处理后的文字数据、图片数据、格式数据以及定位数据,分别生成文字信息、图片信息、格式信息以及定位信息;将文字信息、图片信息、格式信息以及定位信息分别进行打包,发送给上述移动终端。本发明专利技术可快速、准确的识别和显示电子文档。

Document recognition and display method and mobile terminal thereof

The invention discloses a document identification and display method and a mobile terminal thereof, relating to the field of electronic document typesetting and display. The method includes the identification of electronic documents and electronic documents show, including identification of electronic documents include: image data acquisition of electronic documents of the mobile terminal; the image data in the text data and image data are separated; the image data is sent to a plurality of processors, respectively for processing text data, image data, data format and data according to the location; text data, processed image data, data format and location data, generate text information, image information and format information and positioning information; text information, image information and format information and location information are packaged, sent to the mobile terminal. The invention can quickly and accurately identify and display electronic documents.

【技术实现步骤摘要】
一种文档识别和显示方法及其移动终端
本专利技术涉及电子文档排版及显示
,尤其涉及一种文档识别和显示方法及其移动终端。
技术介绍
随着互联网技术的发展,使得消费者对终端设备的要求越来越高,例如,需要手机、电脑、电视等终端具备电子文档的识别和功能。现有技术中,首先终端对电子文档进行识别,之后将识别后的电子文档显示在终端中。但是,现有的识别功能需要终端具有较强的计算能力,如果终端的计算能力差,则存在识别速度缓慢,电子文档的识别精度差等问题,进一步地,由于现有的排版显示形式是基于大屏幕的显示装置,并不适合移动终端显示文档,最终都会影响移动终端对电子文档的显示。
技术实现思路
本专利技术的目的在于提供一种文档识别和显示方法及其识别装置,用于快速准确地识别电子文档并清晰地显示在移动终端。为达到上述目的,本专利技术采用如下技术方案:本专利技术的第一方面提供一种文档识别和显示方法,该文档识别和显示方法包括识别电子文档和显示电子文档,其中识别电子文档包括:S11、移动终端获取电子文档的图像数据。S12、根据获得的图像数据,将图像数据中的文字数据和图片数据进行分离。S13、将图像数据发送至多个处理器,分别进行文字数据、图片数据、格式数据以及定位数据的处理。S14、根据处理后的文字数据、图片数据、格式数据以及定位数据,分别生成文字信息、图片信息、格式信息以及定位信息。S15、将文字信息、图片信息、格式信息以及定位信息分别进行打包,发送给上述移动终端。进一步识别电子文档包括:S16、上述移动终端解析文字信息、图片信息、格式信息以及定位信息。S17、根据解析后的格式信息以及移动终端的显示信息生成显示框架。S18、在显示框架内,根据定位信息,对文字信息以及图片信息进行显示,得到能够显示的电子文档。格式信息包括页面布局和页面属性,根据每一个特定的显示终端对格式信息进行调整,用于显示该电子文档中的所有信息。文字信息能够根据格式信息进行调整;图像信息能够根据格式信息进行调整。页面属性包括:页面的大小、总页数、分辨率、页边距、背景以及屏幕的使用状态。屏幕的信息,包括屏幕尺寸和屏幕分辨率。定位信息包括:文字定位信息、图片定位信息以及文字与图片之间的定位信息;其中,文字定位信息包括,同一页面上的文字之间的前后顺序、同一页面上不同行之间的前后顺序、以及页面之间的前后顺序;图片定位信息包括,同一页面上的图片之间的前后顺序以及不同页面之间的前后顺序;文字与图片之间的定位信息包括,锁定特定图片环绕或前或后的文字,并根据锁定的环绕或前或后的文字,确定该图片的位置。文档识别和显示方法可知,由于采用并行处理方式,从而大幅度提升处理速度;另外,依据格式信息以及移动终端的显示信息动态生成显示框架,从而使得移动终端对文档的显示能力显著提升。本专利技术的第二方面提供一种移动终端,该移动终端用于识别和显示电子文档,其中,该移动终端包括:扫描单元,用于扫描电子文档,并获取电子文档的图像数据;与扫描单元相连的分离单元,用于根据获得的图像数据,将图像数据中的文字数据和图片数据进行分离;与分离单元相连的处理单元,用于将图像数据发送至多个处理器,分别进行文字数据、图片数据、格式数据以及定位数据的处理;与处理单元相连的接收单元,用于接收处理后的根据文字数据、图片数据、格式数据、以及定位数据生成的文字信息、图片信息、格式信息以及定位信息;与接收单元相连的打包单元,用于将文字信息、图片信息、格式信息以及定位信息分别进行打包,发送给上述移动终端。该移动终端还包括:与打包单元相连的解析单元,用于解析文字信息、图片信息、格式信息以及定位信息;与解析单元相连的框架单元,用于根据解析后的格式信息以及移动终端的显示信息生成显示框架;与框架单元相连的显示单元,用于在显示框架内,根据定位信息,对文字信息以及图片信息进行显示,得到能够显示的电子文档。处理单元包括定位模块,用于确定同一页面上的文字之间的前后顺序、同一页面上不同行之间的前后顺序、以及页面之间的前后顺序;用于确定同一页面上的图片之间的前后顺序以及不同页面之间的前后顺序;用于锁定特定图片环绕或前或后的文字,并根据锁定的环绕或前或后的文字,确定该图片的位置。由于本专利技术中的移动终端,可显示根据上述本专利技术的第一方面所形成的电子文档,因此,该移动终端可以通过并行处理方式处理获得的图像数据,从而大幅提高处理文档的速度;进一步地,提升了该移动终端的处理能力。并且,依据格式信息以及移动终端的显示信息动态生成显示框架,从而使得移动终端对文档显示能力显著提升。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为实施例中识别电子文档的流程图;图2为实施例中显示电子文档的流程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例一本实施例提供一种文档识别和显示方法,该文档识别和显示方法包括识别电子文档和显示电子文档,如图1所示,其中识别电子文档包括:S11、移动终端获取电子文档的图像数据。获取电子文档的方式有多种,示例性地,通过移动终端配置扫描仪获得电子文档,或者通过直接将电子文档与扫描仪器进行连接扫描获得电子文档,或者通过其他途径,例如网络下载获得电子文档。S12、根据获得的图像数据,将图像数据中的文字数据和图片数据进行分离。将文字数据和图片数据进行分离的方式有很多种,示例性地,通过在移动终端中置入OCR(OpticalCharacterRecognition,光学字符识别)软件,或者在移动终端的CPU中设置OCR等,将电子文档中的文字和图片进行分离。S13、将图像数据发送至多个处理器,分别进行文字数据、图片数据、格式数据以及定位数据的处理。示例性地,图像数据通过无线或有线的传输方式发送至多个处理器,例如,通过蓝牙等,多个处理器并行的进行处理,从而有效地提高处理速度。S14、根据处理后的文字数据、图片数据、格式数据以及定位数据,分别生成文字信息、图片信息、格式信息以及定位信息。为了使本领域技术人员更加清楚地理解本方案,下面对多个处理器的并行处理过程进行详细的描述:将文字数据发送至处理器一进行文字处理,将图片数据发送至处理器二进行图片处理,将图像数据发送至处理器三进行格式处理,将图像数据发送至处理器四进行定位处理。接收处理器一处理后的文字数据,接收处理器二处理后的图片数据,接收处理器三处理后的格式数据,以及接收处理器四处理后的定位数据,并根据处理后的文字数据、图片数据、格式数据以及定位数据,生成文字信息、图片信息、格式信息,以及定位信息。S15、将文字信息、图片信息,格式信息以及定位信息分别进行打包,发送给上述移动终端。打包过程中,只是对所占空间进行压缩,并不改变信息的前后顺序,具体地,以文字信息为例,文字信息中的每一字符的前后顺序并不会在本文档来自技高网...
一种文档识别和显示方法及其移动终端

【技术保护点】
一种文档识别和显示方法,其特征在于,包括如下步骤:S11、移动终端获取电子文档的图像数据;S12、根据获得的图像数据,将图像数据中的文字数据和图片数据进行分离;S13、将图像数据发送至多个处理器,分别进行文字数据、图片数据、格式数据以及定位数据的处理;S14、根据处理后的文字数据、图片数据、格式数据以及定位数据,分别生成文字信息、图片信息、格式信息以及定位信息;S15、将文字信息、图片信息、格式信息以及定位信息分别进行打包,发送给上述移动终端。

【技术特征摘要】
1.一种文档识别和显示方法,其特征在于,包括如下步骤:S11、移动终端获取电子文档的图像数据;S12、根据获得的图像数据,将图像数据中的文字数据和图片数据进行分离;S13、将图像数据发送至多个处理器,分别进行文字数据、图片数据、格式数据以及定位数据的处理;S14、根据处理后的文字数据、图片数据、格式数据以及定位数据,分别生成文字信息、图片信息、格式信息以及定位信息;S15、将文字信息、图片信息、格式信息以及定位信息分别进行打包,发送给上述移动终端。2.根据权利要求1所述的文档识别和显示方法,其特征在于,进一步包括:S16、上述移动终端解析文字信息、图片信息、格式信息以及定位信息;S17、根据解析后的格式信息以及移动终端的显示信息生成显示框架;S18、在显示框架内,根据定位信息,对文字信息以及图片信息进行显示,得到能够显示的电子文档。3.根据权利要求1或2所述的文档识别和显示方法,其特征在于,格式信息包括页面布局和页面属性,根据每一个特定的显示终端对格式信息进行调整,用于显示该电子文档中的所有信息。4.根据权利要求3所述的文档识别和显示方法,其特征在于,文字信息能够根据格式信息进行调整;图像信息能够根据格式信息进行调整。5.根据权利要求3所述的文档识别和显示方法,其特征在于,页面属性包括:页面的大小、总页数、分辨率、页边距、背景以及屏幕的使用状态。6.根据权利要求5所述的文档识别和显示方法,其特征在于,屏幕的使用状态包括,是否全屏;是否半屏;屏幕亮度的选择;是否横屏。7.根据权利要求1或2所述的文档识别和显示方法,其特征在于,定位信息包括:文字定位信息、图片定位信息以及文字与图片之间的定位信息;其中,文字定位信息包括,同一页面上的文字之间的前后顺序、同一页面...

【专利技术属性】
技术研发人员:郑万林
申请(专利权)人:张家口浩扬科技有限公司
类型:发明
国别省市:河北,13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1