一种文档图像排序的方法、装置及电子设备制造方法及图纸

技术编号:32665653 阅读:17 留言:0更新日期:2022-03-17 11:17
本发明专利技术提供了一种文档图像排序的方法、装置及电子设备,涉及计算机数据处理技术领域,包括获取若干张待处理的图像文档;随机抽取一张待处理的图像文档,并提取抽取的图像文档的最后一个字符;逐一提取剩余的图像文档的第一个字符;判断最后一个字符与第一个字符是否是文字;当最后一个字符与第一个字符均是文字时,判断剩余的图像文档中是否存在第一目标图像文档,第一目标图像文档包括剩余的图像文档中的第一个字符能够与最后一个字符组成词组的待处理的图像文档;当剩余的图像文档中存在一张第一目标图像文档时,抽取的图像文档排列于第一目标图像文档的前面。本申请提高了图像文档有效管理的工作效率,释放人工,将待处理的图像文档进行排序。的图像文档进行排序。的图像文档进行排序。

【技术实现步骤摘要】
一种文档图像排序的方法、装置及电子设备


[0001]本专利技术涉及计算机数据处理
,尤其涉及一种文档图像排序的方法、装置及电子设备。

技术介绍

[0002]现如今,摄像头已经成为智能手机、平板电脑和个人电脑等电子产品的标准配置,人们可以方便的用这些设备获取图像,对于一些信息以拍照的方式进行记录,例如拍摄一些重要的票据、文件等。但是,这些拍摄得到的图像文档存储在这些设备中,由设备根据文件名、拍摄时间或文件大小等信息的顺序进行排序。但是文件名需要由用户来手动设置或者由设备根据拍照的顺序或时间自动生成文件名,拍摄时间或文件大小的随机性也非常强,这些信息与拍摄的内容都没有必然的联系,因此设备对于图像文档的存储顺序是无法参考拍摄内容的,这样对用户的使用而言就具有很大的不便,无法快捷准确的找到需要的图像文档。
[0003]因此,提出一种文档图像排序的方法、装置及电子设备。

技术实现思路

[0004]本说明书提供一种文档图像排序的方法、装置及电子设备,本申请提高了图像文档有效管理的工作效率,释放人工,将待处理的图像文档进行排序。
[0005]本说明书提供一种文档图像排序的方法,包括:
[0006]获取若干张待处理的图像文档;
[0007]随机抽取一张所述待处理的图像文档,并提取抽取的图像文档的最后一个字符;
[0008]逐一提取剩余的图像文档的第一个字符;
[0009]一一判断所述最后一个字符与所述第一个字符是否是文字;
[0010]当所述最后一个字符与所述第一个字符均是文字时,判断所述剩余的图像文档中是否存在第一目标图像文档,所述第一目标图像文档包括所述剩余的图像文档中的所述第一个字符能够与所述最后一个字符组成词组的所述待处理的图像文档;
[0011]当所述剩余的图像文档中存在一张所述第一目标图像文档时,所述抽取的图像文档排列于所述第一目标图像文档的前面;
[0012]返回所述随机抽取一张图像文档,并提取所述抽取的图像文档的最后一个字符,直至若干张所述待处理的图像文档排序完成。
[0013]可选的,所述获取若干张待处理的图像文档之后,还包括:
[0014]对若干张所述待处理的图像文档进行切边、旋转、拉伸以及图像增强中至少一种方式进行图像处理。
[0015]可选的,所述判断所述剩余的图像文档中是否存在第一目标图像文档,包括:
[0016]获取专业领域文档、常用词组库;
[0017]将所述专业领域文档分词,得到专业领域词库;
[0018]判断所述专业领域词库和/或所述常用词组库中是否存在第一目标词组,所述第一目标词组包括所述抽取的图像文档的最后一个字符与所述第一目标图像文档的第一个字符组成的词组。
[0019]可选的,所述方法还包括:
[0020]当所述剩余的图像文档中不存在所述第一目标图像文档时,和/或,当所述剩余的图像文档中存在多个所述第一目标图像文档时:
[0021]提取所述抽取的图像文档的倒数N(N≥2)个字符;
[0022]逐一提取所述第一目标图像文档的顺数N(N≥2)个字符;
[0023]一一判断所述倒数N(N≥2)个字符与所述顺数N(N≥2)个字符是否是文字;
[0024]当所述倒数N(N≥2)个字符与所述顺数N(N≥2)个字符均是文字时,判断所述第一目标图像文档中是否存在第二目标图像文档;
[0025]当所述第一目标图像文档中存在一个所述第二目标图像文档时,所述抽取的图像文档排列于所述第二目标图像文档的前面。
[0026]可选的,所述方法还包括:
[0027]当所述最后一个字符与所述第一个字符不都为文字时,停止后续操作。
[0028]本说明书还提供一种文档图像排序的装置,包括:
[0029]获取模块,用以获取若干张待处理的图像文档;
[0030]抽取模块,用以随机抽取一张图像文档,并提取抽取的图像文档的最后一个字符;
[0031]提取模块,用以逐一提取剩余的图像文档的第一个字符;
[0032]第一判断模块,用以一一判断所述最后一个字符与所述第一个字符是否是文字;
[0033]第二判断模块,用以当所述最后一个字符与所述第一个字符均是文字时,判断所述剩余的图像文档中是否存在第一目标图像文档,所述第一目标图像文档包括所述剩余的图像文档中的所述第一个字符能够与所述最后一个字符组成词组的所述待处理的图像文档;
[0034]排序模块,用以当所述剩余的图像文档中存在一张所述第一目标图像文档时,所述抽取的图像文档排列于所述第一目标图像文档的前面;
[0035]迭代模块,用以返回所述随机抽取一张所述待处理的图像文档,并提取所述抽取的图像文档的最后一个字符,直至若干张所述待处理的图像文档排序完成。
[0036]可选的,所述获取模块之后,包括:
[0037]对若干张所述待处理的图像文档进行切边、旋转、拉伸以及图像增强中至少一种方式进行图像处理。
[0038]可选的,所述判断所述剩余的图像文档中是否存在第一目标图像文档,包括:
[0039]获取专业领域文档、常用词组库;
[0040]将所述专业领域文档分词,得到专业领域词库;
[0041]判断所述专业领域词库和/或所述常用词组库中是否存在第一目标词组,所述第一目标词组包括所述抽取的图像文档的最后一个字符与所述第一目标图像文档的第一个字符组成的词组。
[0042]可选的,所述装置还包括:
[0043]当所述剩余的图像文档中不存在所述第一目标图像文档时,和/或,当所述剩余的
图像文档中存在多个所述第一目标图像文档时:
[0044]提取所述抽取的图像文档的倒数N(N≥2)个字符;
[0045]逐一提取所述第一目标图像文档的顺数N(N≥2)个字符;
[0046]判断所述倒数N(N≥2)个字符与所述顺数N(N≥2)个字符是否是文字;
[0047]当所述倒数N(N≥2)个字符与所述顺数N(N≥2)个字符均是文字时,判断所述第一目标图像文档中是否存在第二目标图像文档;
[0048]当所述第一目标图像文档中存在一个所述第二目标图像文档时,所述抽取的图像文档排列于所述第二目标图像文档的前面。
[0049]可选的,所述装置还包括:
[0050]停止模块,用以当所述最后一个字符与所述第一个字符不都为文字时,停止后续操作。
[0051]本说明书还提供一种电子设备,其中,该电子设备包括:
[0052]处理器;以及,
[0053]存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行上述任一项方法。
[0054]本说明书还提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现上述任一项方法。
[0055]本说明书中,通过图像文档抽取字符,然本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文档图像排序的方法,其特征在于,包括:获取若干张待处理的图像文档;随机抽取一张所述待处理的图像文档,并提取抽取的图像文档的最后一个字符;逐一提取剩余的图像文档的第一个字符;一一判断所述最后一个字符与所述第一个字符是否是文字;当所述最后一个字符与所述第一个字符均是文字时,判断所述剩余的图像文档中是否存在第一目标图像文档,所述第一目标图像文档包括所述剩余的图像文档中的所述第一个字符能够与所述最后一个字符组成词组的所述待处理的图像文档;当所述剩余的图像文档中存在一张所述第一目标图像文档时,所述抽取的图像文档排列于所述第一目标图像文档的前面;返回所述随机抽取一张图像文档,并提取所述抽取的图像文档的最后一个字符,直至若干张所述待处理的图像文档排序完成。2.如权利要求1所述的方法,其特征在于,所述获取若干张待处理的图像文档之后,还包括:对若干张所述待处理的图像文档进行切边、旋转、拉伸以及图像增强中至少一种方式进行图像处理。3.如权利要求1所述的方法,其特征在于,所述判断所述剩余的图像文档中是否存在第一目标图像文档,包括:获取专业领域文档、常用词组库;将所述专业领域文档分词,得到专业领域词库;判断所述专业领域词库和/或所述常用词组库中是否存在第一目标词组,所述第一目标词组包括所述抽取的图像文档的最后一个字符与所述第一目标图像文档的第一个字符组成的词组。4.如权利要求3所述的方法,其特征在于,还包括:当所述剩余的图像文档中不存在所述第一目标图像文档时,和/或,当所述剩余的图像文档中存在多个所述第一目标图像文档时:提取所述抽取的图像文档的倒数N(N≥2)个字符;逐一提取所述第一目标图像文档的顺数N(N≥2)个字符;一一判断所述倒数N(N≥2)个字符与所述顺数N(N≥2)个字符是否是文字;当所述倒数N(N≥2)个字符与所述顺数N(N≥2)个字符均是文字时,判断所述第一目标图像文档中是否存在第二目标图像文档;当所述第一目标图像文档中存在一个所述第二目标图像文档时,所述抽取的图像文档排列于所述第二目标图像文档的前面。5.如权利要求...

【专利技术属性】
技术研发人员:李霞朱道勤张冲黄建强
申请(专利权)人:上海卓繁信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1