本发明专利技术提供一种方便电子化的专业笔记本及其页码自动识别方法,该方法包括:拍摄方便电子化的专业笔记本的纸质页面图像;根据纸质页面图像确定纸质页面的类型,从而获得印刷在专业笔记本的纸质页面上的页码标注区域在纸质页面中的位置;通过图像中的直线检测方法确定纸质页面图像的四条边缘线,并将四条边缘线所限定的页面区域校正为方形区域,确定方形区域中页码标注区域的准确位置;识别页码标注区域中的页码内容加入到纸质页面的电子化文档中。本发明专利技术通过在笔记本纸质页面上印刷页码标注区域,并在用CamScanner等应用软件对笔记本纸质页面进行电子化的时候自动识别该页码标注区域的页码内容,从而方便电子化文档管理和查询。
【技术实现步骤摘要】
本专利技术属于电子计算机
,涉及一种电子化文档的页码识别方法,特别是涉及一种。
技术介绍
在日常生活中,人们经常需要拍摄纸质文档,保存成JPEG格式的照片,或者生成PDF格式的文档,从而实现纸质文档的电子化,方便管理。智能手机就是常用的将纸质文档电子化的工具之一。因为智能手机上一般都带有摄像头,利用手机上的摄像头可以拍摄纸质文档,并将拍摄得到的电子文档进行一定的图像处理后再转换成JPEG格式的照片,或 者生成PDF格式的文档。具备上述功能的应用软件也已经比较普及了,如苹果应用商店和google应用商店中的应用CamScanner。这些应用软件可以从拍摄的图像中自动监测出所拍摄文档的四条边,以此为基准切除图像中文档区域外面的背景,并对文档区域进行校正和图像增强等处理,获得一个类似于用扫描仪扫描得到的整洁干净的电子化文档的效果,以用户指定的格式进行保存和管理。常见的需要进行电子化的纸质文档是纸件笔记本页面,长期以来人们经常用纸件笔记本来做各种记录,如会议记录,备忘事项记录等等,一本纸件笔记本中会有几十甚至上百页纸,而且同一类型的笔记本,其所有用来记录的纸页的样式一般是统一的。有些笔记本页面上印有页码,但是一般的笔记本页面上是不印页码的,笔记本页面上所印的最下面一条分行线的下面,直到页面的下边缘都是空白的,只是为了美观,没有实际作用。用CamScanner等应用软件对笔记本页面进行电子化,以JPEG图像的格式或者PDF文档的格式保存到智能手机等电子设备中去以后,随着电子化的页面数量的增加,对其进行管理和检索会越来越困难。比如说,当人们看到一个纸质的笔记本页面上记录的事项,想找到该页面的电子化文档,察看曾经在这个电子化文档上做的批注的时候,就可能需要在几百上千个电子化文档中逐一搜索,非常麻烦。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种,用于解决现有技术中纸质页面的电子化文档的顺序混乱,不易实现内容的管理和查询的问题。为实现上述目的及其他相关目的,本专利技术提供一种。一种方便电子化的专业笔记本,所述方便电子化的专业笔记本的纸质页面上印刷有页码标注区域。优选地,所述页码标注区域固定设于所述纸质页面上的指定位置。一种方便电子化的专业笔记本的页码自动识别方法,所述方便电子化的专业笔记本的页码自动识别方法包括拍摄方便电子化的专业笔记本的纸质页面图像;根据所述纸质页面图像确定所述纸质页面的类型,从而获得印刷在所述专业笔记本的纸质页面上的页码标注区域在所述纸质页面中的位置;通过图像中的直线检测方法确定所述纸质页面图像的四条边缘线,并将四条边缘线所限定的页面区域校正为方形区域,确定所述方形区域中页码标注区域的准确位置; 识别所述页码标注区域中的页码内容加入到所述纸质页面的电子化文档中。优选地,所述纸质页面的类型由该纸质页面的大小和格式决定;所述纸质页面的格式包括纸质页面上印刷的分行线的数目,或/和是否有页码标注区域、或/和页码标注区域的大小和位置。优选地,所述页码标注区域固定设于所述纸质页面上的指定位置。优选地,在所述纸质页面的类型为预先已知的情况下,根据所述纸质页面图像确定所述纸质页面的类型的具体实现方式为人工指定所述纸质页面的类型。优选地,在所述纸质页面的类型为预先已知的情况下,根据所述纸质页面图像确定所述纸质页面的类型的具体实现方式为在所述纸质页面上的固定位置处印刷有一类型标记;检测所述纸质页面图像上的类型标记,将该检测到的类型标记与预先已知的类型标记进行一一比较,找出所述纸质页面所属的类型。优选地,在所述纸质页面的类型为预先不知的情况下,根据所述纸质页面图像确定所述纸质页面的类型的具体实现方式为创建新的纸质页面的类型,输入该未知的纸质页面的大小和格式。优选地,所述页码标注区域为印刷字体区域或手写字体区域。优选地,当所述页码标注区域为手写字体区域时,判断所述页码标注区域是否为空白,若不是则进行页码识别,否则不进行页码识别;具体判断方法为对所述页码标注区域的图像块进行二值化处理,检测其中代表用户笔迹的前景点像素的个数,如果该个数在整个页码标注区域中所占的比例超过预设阈值,则所述页码标注区域不是空白的,否则即是空白的。如上所述,本专利技术所述的,具有以下有益效果本专利技术通过在笔记本纸质页面上印刷页码标注区域,并在用CamScanner等应用软件对笔记本纸质页面进行电子化的时候自动识别该页码标注区域的页码内容,解决了纸质页面的电子化文档的顺序混乱的问题,方便电子化文档管理和查询。附图说明图I显示为本专利技术所述的方便电子化的专业笔记本的一种结构示意图。图2显示为本专利技术所述的方便电子化的专业笔记本的另一种结构示意图。图3显示为本专利技术所述的方便电子化的专业笔记本的页码自动识别方法的流程示意图。元件标号说明100 纸质页面;101 页码标注区域。具体实施例方式以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。请参阅附图。需要说明的是,本实施例中所提供的图示仅以示意方式说明本专利技术的基本构想,遂 图式中仅显示与本专利技术中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。下面结合实施例和附图对本专利技术进行详细说明。实施例一本实施例提供一种方便电子化的专业笔记本,如图I所示,所述方便电子化的专业笔记本的纸质页面100上印刷有页码标注区域101。具体地,所述页码标注区域101固定设于所述纸质页面100上的指定位置。这样在该纸质页面100电子化的时候就可以准确扫描到页码标注区域101,抽取页码标注区域101中的页码内容添加到该页码的电子化文档中。上述指定位置可以为纸质页面的任意位置,如纸质页面的页眉位置,或页脚位置等,参见图I和图2。本实施例还提供一种方便电子化的专业笔记本的页码自动识别方法,其中所述方便电子化的专业笔记本即为本实施例提供的方便电子化的专业笔记本,如图3所示,所述方便电子化的专业笔记本的页码自动识别方法包括拍摄方便电子化的专业笔记本的纸质页面图像。本实施例中,所述方便电子化的专业笔记本的纸质页面上印刷有页码标注区域。所述页码标注区域固定设于所述纸质页面上的指定位置。这样在该纸质页面电子化的时候就可以准确扫描到页码标注区域,抽取页码标注区域中的页码内容。所述页码标注区域用以供用户书写或印刷页码,比如说在笔记本页面的最后一条分行线的下面,用虚线印刷一个矩形区域,提示用户可在其中书写页码。该页码可以是数字形式,也可以是字母形式,或者任何能分辨出先后顺序的形式。根据所述纸质页面图像确定所述纸质页面的类型,从而获得印刷在所述专业笔记本的纸质页面上的页码标注区域在所述纸质页面中的位置。本实施例中,所述纸质页面的类型由该纸质页面的大小和格式决定;所述纸质页面的格式包括纸质页面上印刷的分行线的数目,或/和是否有页码标注区域、或/和页码标注区域的大小和位置。也就是说,所述纸质页面的格式可以为任意种情况,例如该纸质页面上仅印刷本文档来自技高网...
【技术保护点】
一种方便电子化的专业笔记本,其特征在于,所述方便电子化的专业笔记本的纸质页面上印刷有页码标注区域。
【技术特征摘要】
【专利技术属性】
技术研发人员:曹璐,镇立新,罗希平,
申请(专利权)人:上海合合信息科技发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。