【技术实现步骤摘要】
信息处理方法、信息处理设备和扫描仪
本公开总体上涉及信息处理领域,具体而言,涉及用于处理包含文本内容的多个扫描图像的信息处理方法以及能够实现该信息处理方法的信息处理设备和扫描仪。
技术介绍
银行、旅游服务中心、街道办事处、出入境大厅等组织机构通常需要每天收集来自不同客户或申请人的大量文件并进行分类。每个客户或申请人可能提供不同类型的多项文件,如身份证、银行卡、婚姻证明、户籍证明、申请表格、相关合同及其他证明文件等,并且自行扫描或由相关机构的工作人员扫描,从而保存电子版。借助于现有的扫描仪等设备,可以自动收集所有文档图像。然而,扫描文档图像的后续分类工作仍需要手动完成。对于相关机构而言,这是一项庞大而繁重的工作,耗费了大量的人力资源。因此,期望提供一种能对扫描文档图像(也可称为包含文本内容的扫描图像)进行自动分类的方法,以提高处理效率。
技术实现思路
在下文中给出了关于本专利技术的简要概述,以便提供关于本专利技术的某些方面的基本理解。应当理解,这个概述并不是关于本专利技术的穷举性概述。它并不 ...
【技术保护点】
1.一种信息处理设备,用于处理包含文本内容的多个扫描图像,所述装置包括:/n处理器,被配置为/n在多个扫描图像中分别识别标题文本;/n根据识别的结果,将每个扫描图像分类为预定义的多个文本类别之一或者未知文本类别;/n利用基于卷积神经网络的特征提取器,从被分类为未知文本类别的扫描图像中分别提取图像特征;以及/n根据所提取的图像特征,将每个被分类为未知文本类别的扫描图像分类为预定义的多个结构类别之一或者未知结构类别。/n
【技术特征摘要】
1.一种信息处理设备,用于处理包含文本内容的多个扫描图像,所述装置包括:
处理器,被配置为
在多个扫描图像中分别识别标题文本;
根据识别的结果,将每个扫描图像分类为预定义的多个文本类别之一或者未知文本类别;
利用基于卷积神经网络的特征提取器,从被分类为未知文本类别的扫描图像中分别提取图像特征;以及
根据所提取的图像特征,将每个被分类为未知文本类别的扫描图像分类为预定义的多个结构类别之一或者未知结构类别。
2.如权利要求1所述的信息处理设备,其中,处理器被进一步配置为:
利用基于连接文本提议网络的文本行检测方法,在多个扫描图像中分别检测标题文本行。
3.如权利要求2所述的信息处理设备,其中,处理器被进一步配置为:
利用基于卷积循环神经网络的序列文本识别方法,从所检测到的标题文本行中识别标题文本。
4.如权利要求1所述的信息处理设备,其中,通过针对预定义的多个结构类别,基于标记好的训练图像对基于卷积神经网络的分类器进行训练而获得基于神经网络的特征提取器。
5.如权利要求1至4中任一项所述的信息处理设备,其中,多个扫描图像是通过批扫描获得的。
6.如权利要求5所述的信息处理设备,其中,处理器被进...
【专利技术属性】
技术研发人员:王涛,孙俊,于小亿,
申请(专利权)人:富士通株式会社,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。