文字提取方法及装置制造方法及图纸

技术编号:15501783 阅读:47 留言:0更新日期:2017-06-03 22:59
本公开是关于一种文字提取方法及装置。该方法包括:提取多张图片中每张图片的文字,生成多组文字信息,其中,所述多组文字信息与所述多张图片一一对应;按照预设顺序排列所述多组文字信息;根据排列后的所述多组文字信息,生成文档。该技术方案中,若相册中存储大量课件图片,可以将课件图片中的文字提取为文字信息,并将该文字信息整理成逻辑清晰的文档,用户可以保留生成的文档,删除相册中的课件图片,这样一来,用户可以较为便捷的查阅课件信息,同时节约了相册的存储空间,提高了用户体验。

Text extraction method and apparatus

The present disclosure relates to a text extraction method and apparatus. The method includes: extracting each picture pictures in the text, generates multiple text information, wherein the plurality of text information and the corresponding picture; according to the preset order the plurality of text information; according to the arrangement after the plurality of text information, generate documents. In the technical proposal, if the album pictures can store a lot of courseware, the courseware picture text extraction in text information, the text information and document the logic clear, users can keep the generated document, delete the album in the courseware picture, so that users can be more convenient access to information and courseware. Save the storage space of the album, improve the user experience.

【技术实现步骤摘要】
文字提取方法及装置
本公开涉及信息处理
,尤其涉及一种文字提取方法及装置。
技术介绍
目前,大部分手机都具有拍照功能。用户在日常生活中遇到需要记录的重要信息时,往往来不及采用备忘录进行记录,此时用户可以打开照相机拍摄图片,之后在按照所拍摄的图片整理出所需信息,提高了用户记录信息的便捷性。
技术实现思路
为克服相关技术中存在的问题,本公开实施例提供一种文字提取方法及装置。所述技术方案如下:根据本公开实施例的第一方面,提供一种文字提取方法,包括:提取多张图片中每张图片的文字,生成多组文字信息,其中,所述多组文字信息与所述多张图片一一对应;按照预设顺序排列所述多组文字信息;根据排列后的所述多组文字信息,生成文档。本公开的实施例提供的技术方案可以包括以下有益效果:若相册中存储大量课件图片,可以将课件图片中的文字提取为文字信息,并将该文字信息整理成逻辑清晰的文档,用户可以保留生成的文档,删除相册中的课件图片,这样一来,用户可以较为便捷的查阅课件信息,同时节约了相册的存储空间,提高了用户体验。在一个实施例中,所述生成多组文字信息包括:根据提取到的每张图片的文字和每张图片的文字排版,生成每张图片对应的一组文字信息,每组文字信息的文字排版和与其对应的图片的文字排版相同。本公开的实施例提供的技术方案可以包括以下有益效果:按照每张课件图片中的文字排版,提取并生成的每张课件图片对应的一组文字信息,使得每组文字信息的文字排版和与其对应的图片的文字排版相同,避免了因为改变了文字排版导致用户无法分辨课件中重点内容的情况,提高了用户体验。在一个实施例中,所述按照预设顺序排列所述多组文字信息包括:按照所述多张图片的排列顺序排列所述多组文字信息。本公开的实施例提供的技术方案可以包括以下有益效果:由于图片的排列顺序反映了课件的先后顺序,因此根据图片的排列顺序排列多组文字信息,可以保证文字信息的连贯性,使得生成的文档逻辑清晰,便于用户查阅。在一个实施例中,所述方法还包括:根据用户操作,调整所述文档中所述多组文字信息的组与组之间的先后顺序。本公开的实施例提供的技术方案可以包括以下有益效果:在提取到多张图片的文字信息之后,用户可以根据逻辑顺序调整多组文字信息的排列顺序,使得生成的文档逻辑清晰,便于用户查阅。在一个实施例中,所述根据排列后的所述多组文字信息,生成文档包括:根据所述排列后的多组文字信息,生成可编辑文档。本公开的实施例提供的技术方案可以包括以下有益效果:生成可编辑文档,使得用户可以根据需要在已生成的可编辑文档中添加新的内容,提高了用户使用文档的灵活性,进一步提高了用户体验。在一个实施例中,所述可编辑文档中相邻两组文字信息之间设置有分隔标识。本公开的实施例提供的技术方案可以包括以下有益效果:生成可编辑文档中相邻两组文字信息之间设置有分隔标识,便于用户区分不同的文字信息,确定查阅的位置。根据本公开实施例的第二方面,提供一种文字提取装置,包括:提取模块,用于提取多张图片中每张图片的文字,生成多组文字信息,其中,所述多组文字信息与所述多张图片一一对应;排列模块,用于按照预设顺序排列所述多组文字信息;生成模块,用于根据所述排列后的所述多组文字信息,生成文档。在一个实施例中,所述生成模块包括:生成子模块,用于根据提取到的每张图片的文字和每张图片的文字排版,生成每张图片对应的一组文字信息,每组文字信息的文字排版和与其对应的图片的文字排版相同。在一个实施例中,所述排列模块包括:排列子模块,用于按照所述多张图片的排列顺序排列所述多组文字信息。在一个实施例中,所述装置还包括:调整模块,用于根据用户操作,调整所述文档中所述多组文字信息的组与组之间的先后顺序。在一个实施例中,所述生成模块根据所述排列后的多组文字信息,生成可编辑文档。在一个实施例中,所述可编辑文档中相邻两组文字信息之间设置有分隔标识。根据本公开实施例的第三方面,提供一种文字提取装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:提取多张图片中每张图片的文字,生成多组文字信息,其中,所述多组文字信息与所述多张图片一一对应;按照预设顺序排列所述多组文字信息;根据排列后的所述多组文字信息,生成文档。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。图1a是根据一示例性实施例示出的文字提取方法的流程图1。图1b是根据一示例性实施例示出的文字提取方法的流程图2。图1c是根据一示例性实施例示出的文字提取方法的流程图3。图1d是根据一示例性实施例示出的文字提取方法的流程图4。图1e是根据一示例性实施例示出的文字提取方法的流程图5。图2是根据一示例性实施例示出的文字提取方法的流程图6。图3是根据一示例性实施例示出的文字提取方法的流程图7。图4a是根据一示例性实施例示出的文字提取装置的结构示意图1。图4b是根据一示例性实施例示出的文字提取装置的结构示意图2。图4c是根据一示例性实施例示出的文字提取装置的结构示意图3。图4d是根据一示例性实施例示出的文字提取装置的结构示意图4。图5是根据一示例性实施例示出的文字提取装置的结构框图1。图6是根据一示例性实施例示出的文字提取装置的结构框图2。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。本公开实施例提供的技术方案用于终端,所述终端包括手机,平板电脑,以及其他能够拍摄并保存图片的设备。实际应用中,若用户正在接受培训,讲师在讲解的过程中为了便于用户理解讲解内容,可以使用投影仪播放课件。用户为了更好的记录讲解的重点,可以使用手机的照相功能将播放的课件拍摄下来。但是一般的课件页数较多,用户可能需要拍摄多张图片才能记录完整,这些课件图片会占用大量的存储空间,导致终端可用的存储空间减小。并且用户在查看图片格式的课件时,需要来回翻页以便于衔接相邻两页课件之间的内容,较为不便。本公开实施例中,终端可以提取课件图片中的文字,获取每张课件图片对应的文字信息,然后根据这些文字信息生成文档供用户查阅,因此用户可以较为便捷的查阅课件信息,同时节约了终端相册的存储空间,提高了用户体验。图1a是根据一示例性实施例示出的一种文字提取方法的流程图,所述文字提取方法用于终端,所述终端包括手机,平板电脑,以及其他能够拍摄并保存图片的设备,本公开实施例在此不做限定。如图1a所示,所述文字提取方法包括以下步骤101至步骤103:在步骤101中,提取多张图片中每张图片的文字,生成多组文字信息。通常的,讲师的课件除小部分示意图之外,其他大部分内容都以文字的形式体现。这些文字以图片的形式进行存储,占用了大量的存储空间,因此在终端中存储有大量课件图片时,用户可以根据需要选择其中的多张图片,依次提取每张图片的文字,组成每张图片对应的文字信息,即生成多组文字信息,其中,多组本文档来自技高网...
文字提取方法及装置

【技术保护点】
一种文字提取方法,其特征在于,包括:提取多张图片中每张图片的文字,生成多组文字信息,其中,所述多组文字信息与所述多张图片一一对应;按照预设顺序排列所述多组文字信息;根据排列后的所述多组文字信息,生成文档。

【技术特征摘要】
1.一种文字提取方法,其特征在于,包括:提取多张图片中每张图片的文字,生成多组文字信息,其中,所述多组文字信息与所述多张图片一一对应;按照预设顺序排列所述多组文字信息;根据排列后的所述多组文字信息,生成文档。2.根据权利要求1所述的方法,其特征在于,所述生成多组文字信息包括:根据提取到的每张图片的文字和每张图片的文字排版,生成每张图片对应的一组文字信息,每组文字信息的文字排版和与其对应的图片的文字排版相同。3.根据权利要求1或2所述的方法,其特征在于,所述按照预设顺序排列所述多组文字信息包括:按照所述多张图片的排列顺序排列所述多组文字信息。4.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:根据用户操作,调整所述文档中所述多组文字信息的组与组之间的先后顺序。5.根据权利要求1或2所述的方法,其特征在于,所述根据排列后的所述多组文字信息,生成文档包括:根据所述排列后的多组文字信息,生成可编辑文档。6.根据权利要求5所述的方法,其特征在于,所述可编辑文档中相邻两组文字信息之间设置有分隔标识。7.一种文字提取装置,其特征在于,包括:提取模块,用于提取多张图片中每张图片的文字,生成多组文字信息,其中,所述多组文字信息与所述多张图片一一对应;排列模...

【专利技术属性】
技术研发人员:刘洁
申请(专利权)人:北京小米移动软件有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1