The present disclosure relates to a text extraction method and apparatus. The method includes: extracting each picture pictures in the text, generates multiple text information, wherein the plurality of text information and the corresponding picture; according to the preset order the plurality of text information; according to the arrangement after the plurality of text information, generate documents. In the technical proposal, if the album pictures can store a lot of courseware, the courseware picture text extraction in text information, the text information and document the logic clear, users can keep the generated document, delete the album in the courseware picture, so that users can be more convenient access to information and courseware. Save the storage space of the album, improve the user experience.
【技术实现步骤摘要】
文字提取方法及装置
本公开涉及信息处理
,尤其涉及一种文字提取方法及装置。
技术介绍
目前,大部分手机都具有拍照功能。用户在日常生活中遇到需要记录的重要信息时,往往来不及采用备忘录进行记录,此时用户可以打开照相机拍摄图片,之后在按照所拍摄的图片整理出所需信息,提高了用户记录信息的便捷性。
技术实现思路
为克服相关技术中存在的问题,本公开实施例提供一种文字提取方法及装置。所述技术方案如下:根据本公开实施例的第一方面,提供一种文字提取方法,包括:提取多张图片中每张图片的文字,生成多组文字信息,其中,所述多组文字信息与所述多张图片一一对应;按照预设顺序排列所述多组文字信息;根据排列后的所述多组文字信息,生成文档。本公开的实施例提供的技术方案可以包括以下有益效果:若相册中存储大量课件图片,可以将课件图片中的文字提取为文字信息,并将该文字信息整理成逻辑清晰的文档,用户可以保留生成的文档,删除相册中的课件图片,这样一来,用户可以较为便捷的查阅课件信息,同时节约了相册的存储空间,提高了用户体验。在一个实施例中,所述生成多组文字信息包括:根据提取到的每张图片的文字和每张图片的文字排版,生成每张图片对应的一组文字信息,每组文字信息的文字排版和与其对应的图片的文字排版相同。本公开的实施例提供的技术方案可以包括以下有益效果:按照每张课件图片中的文字排版,提取并生成的每张课件图片对应的一组文字信息,使得每组文字信息的文字排版和与其对应的图片的文字排版相同,避免了因为改变了文字排版导致用户无法分辨课件中重点内容的情况,提高了用户体验。在一个实施例中,所述按照预设顺序排列所述多组文 ...
【技术保护点】
一种文字提取方法,其特征在于,包括:提取多张图片中每张图片的文字,生成多组文字信息,其中,所述多组文字信息与所述多张图片一一对应;按照预设顺序排列所述多组文字信息;根据排列后的所述多组文字信息,生成文档。
【技术特征摘要】
1.一种文字提取方法,其特征在于,包括:提取多张图片中每张图片的文字,生成多组文字信息,其中,所述多组文字信息与所述多张图片一一对应;按照预设顺序排列所述多组文字信息;根据排列后的所述多组文字信息,生成文档。2.根据权利要求1所述的方法,其特征在于,所述生成多组文字信息包括:根据提取到的每张图片的文字和每张图片的文字排版,生成每张图片对应的一组文字信息,每组文字信息的文字排版和与其对应的图片的文字排版相同。3.根据权利要求1或2所述的方法,其特征在于,所述按照预设顺序排列所述多组文字信息包括:按照所述多张图片的排列顺序排列所述多组文字信息。4.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:根据用户操作,调整所述文档中所述多组文字信息的组与组之间的先后顺序。5.根据权利要求1或2所述的方法,其特征在于,所述根据排列后的所述多组文字信息,生成文档包括:根据所述排列后的多组文字信息,生成可编辑文档。6.根据权利要求5所述的方法,其特征在于,所述可编辑文档中相邻两组文字信息之间设置有分隔标识。7.一种文字提取装置,其特征在于,包括:提取模块,用于提取多张图片中每张图片的文字,生成多组文字信息,其中,所述多组文字信息与所述多张图片一一对应;排列模...
【专利技术属性】
技术研发人员:刘洁,
申请(专利权)人:北京小米移动软件有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。