本文公开一种用于文档分类的系统。该系统的示例包括光源、相机、图像特征数据库及处理器,该相机用于采集文档的视频帧,该图像特征数据库包括与文档的类型相关的数据。该系统附加地包括非暂时性存储介质,该非暂时性存储介质包括指令,该指令在由该处理器执行时引起该处理器:将该文档的第一视频帧与该文档的第二视频帧作比较以确定是否已发生动作,基于第一视频帧或第二视频帧生成文档的图像描述,将该文档的图像描述与该图像特征数据库中与文档的类型相关的数据做比较,以及基于与所述数据的比较而分类该文档的图像描述。本文还公开了一种文档分类方法及计算机程序。
【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】本文公开一种用于文档分类的系统。该系统的示例包括光源、相机、图像特征数据库及处理器,该相机用于采集文档的视频帧,该图像特征数据库包括与文档的类型相关的数据。该系统附加地包括非暂时性存储介质,该非暂时性存储介质包括指令,该指令在由该处理器执行时引起该处理器:将该文档的第一视频帧与该文档的第二视频帧作比较以确定是否已发生动作,基于第一视频帧或第二视频帧生成文档的图像描述,将该文档的图像描述与该图像特征数据库中与文档的类型相关的数据做比较,以及基于与所述数据的比较而分类该文档的图像描述。本文还公开了一种文档分类方法及计算机程序。【专利说明】文档分类
技术介绍
终端用户欣赏电子设备的易于使用性和可靠性。例程和/或常规任务的自动化也 是期望的。因此,设计者和制造商会尝试创建或建立对准这些目标中一个或多个目标的电 子设备。 【专利附图】【附图说明】 下面的详细描述参照附图,其中: 图1是用于文档分类的系统的示例。 图2是用于文档分类的流程图的示例。 图3是文档分类的方法的示例。 图4是图3的文档分类的方法的附加要素的示例。 【具体实施方式】 当采集文档的图像以用于电子存储时,对这样的文档进行分类以用于之后的检索 和使用是有用的。随着这样存储的文档数量的增加,这是特别实际的。这样的分类有助于 提供对之前采集的文档的更快检索及其它任务,如文档收集管理及编辑。 终端用户越容易执行这样的文档图像采集及分类,则越好。能够做几件事来完成 这一点,如提供在采集后自动地分类文档的系统、方法及计算机程序。这样的系统、方法和 计算机程序可以为终端用户提供与这样的分类的确定性有关的可信度。这将向终端用户警 示特定文档误分类的可能问题,文档误分类可以在文档图像采集时被纠正,这有助于增强 文档图像收集的完整性和价值。 允许这样的文档图像采集及分类在自然的和/或人工的各种照明条件下发生,也 提高了这种系统、方法和计算机程序的鲁棒性和可靠性。例如,终端用户可以在由于间歇性 的云的原因而周期性地转阴的阳光充足的条件下开始工作。作为另一示例,在该系统、方法 和计算机程序的不同使用时间期间,终端用户可以在不同类型的人工照明(例如白炽的和 荧光的)之间切换。 通过使用各种不同类型的设备和部件允许这样的文档图像采集及分类发生,额外 地增加了这样的系统、方法和计算机程序的有效性、可访问性及多功能性。例如,允许使用 具有不同层次质量、特征和成本的各种不同类型的相机。作为另一示例,允许使用来自复杂 大型机和服务器以及个人计算机、便携式计算机和平板计算机的各种不同计算设备。图1 示出这样用于文档分类的系统10的示例。 如本文所用的,术语"非暂时性存储介质"以及"非暂时性计算机可读存储介质" 被定义为包括但不一定限于:能够包含、存储或保持程序、信息及数据的任意介质。非暂时 性存储介质和非暂时性计算机可读存储介质可以包括许多物理介质中的任一种,如电子介 质、磁性介质、光介质、电磁介质或半导体介质。合适的非暂时性存储介质及非暂时性计算 机可读存储介质的更具体示例包括但不限于:磁性计算机盘(如软盘或硬驱)、磁带、随机 存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、闪驱、光盘(CD) 或数字视频光盘〇)VD)。 如本文所用的,术语"处理器"被定义为包括但不一定限于:指令执行系统,如基于 计算机/处理器的系统、专用集成电路(ASIC)、计算设备、或能够从非暂时性存储介质或非 暂时性计算机可读存储介质取得或获取逻辑并执行非暂时性存储介质或非暂时性计算机 可读存储介质中包含的指令的硬件和/或软件系统。"处理器"还可以包括任意控制器,状 态机,微处理器,基于云的实体、服务或特征,或它们的任意其它模拟的、数字的和/或机械 的实现方式。 如本文所用的,"相机"被定义为包括但不一定限于:以数字(例如,网络相机或视 频相机)或模拟(例如,胶片)格式采集图像的设备。这些图像可以是彩色的或黑白的。如 本文所用的,"视频"被定义为包括但不一定限于:采集、记录、处理、传送和/或存储图像的 序列。如本文所用的,"视频帧"被定义为包括但不一定限于视频图像。 如本文所用的,"文档"被定义为包括但不一定限于被写的、被印刷的或电子的物 质、信息、数据或提供信息或传递表达的物品。文档的示例包括:文本、一个或多个照片、名 片、收据、邀请函等等。如本文所用的,"计算机程序"被定义为包括但不一定限于用于用处 理器执行任务的指令。"光源"和"照明"被定义为包括但不一定限于:自然的(例如阳光、 日光等)、人工的(例如白炽的、荧光的、LED等等)或其结合的具有任意波长和/或强度的 一个或多个照明源。 再次参照图1,系统10包括光源12以及用于采集文档16的视频帧的相机14。如 大体由虚线箭头20和22表示的那样,文档16被例如终端用户置于表面18上,使得可以采 集这样的视频帧。如下面更充分地讨论的,根据系统10的配置以及这样的采集的成效,这 些被采集的视频帧可以是连续的或非连续的。表面18可以包括用于文档16的任意类型的 支撑(例如,桌子、垫子、台、座等),且包括允许该表面区别于文档16的至少一个特性(例 如,颜色、纹理、抛光、外形等)。 如图1中能够看到的,系统10附加地包括处理器24以及图像特征数据库26,图 像特征数据库26包括与文档的一个或多个类型相关的数据。如图1中附加地能够看到的, 系统10附加地包括非暂时性存储介质28,非暂时性存储介质28包括指令(例如,计算机 程序),如下面更充分地讨论的,该指令在由处理器24执行令时引起处理器24将由相机14 采集的文档16的第一视频帧与由相机14采集的文档16的第二视频帧做比较,以确定是否 已发生动作。 非暂时性存储介质28还包括其它指令,还如下面更充分地讨论的,该指令在由处 理器24执行时引起处理器24基于第一视频帧或第二视频帧生成文档16的图像描述以及 引起处理器24将文档16的该图像描述与图像特征数据库26中与文档的该类型有关的数 据做比较。非暂时性存储介质28进一步包括指令,如下面附加地更充分地讨论的,该指令 在由处理器24执行时引起处理器24基于与图像特征数据库26中与文档的该类型有关的 数据的比较,对文档16的图像描述进行分类。非暂时性存储介质28可以更进一步包括指 令,如下面进一步讨论的,该指令在由处理器24执行时,引起处理器24确定文档16的图像 描述的分类的可信度。 如图1中能进一步看到的,处理器24联接至非暂时性存储介质28,如大体由双头 箭头30表示的,以接收上述指令、接收和评估来自图像特征数据库26的数据以及将数据写 或存储至非暂时性存储介质28。处理器24还联接至相机14,如大体由双头箭头32所表示 的,以接收由相机14采集的文档16的视频帧以及控制相机14的操作。尽管在图1中将图 像特征数据库26示出为位于非暂时性存储介质28上,但是应理解,在系统10的其它示例 中,图像特征数据库26可以与非暂时性存储介质28分离。 图2示出通过系统10的用于文档分类的流程图34的示例。流程图34的技术或本文档来自技高网...
【技术保护点】
一种文档分类方法,包括:采集文档的第一视频帧;采集所述文档的第二视频帧;将所述文档的所述第一视频帧与所述文档的所述第二视频帧做比较,以确定是否已发生动作;基于所述第一视频帧和所述第二视频帧中的一个,生成所述文档的图像描述;将所述文档的所述图像描述与图像特征数据库做比较;以及基于该比较,分类所述文档的所述图像描述。
【技术特征摘要】
【国外来华专利技术】
【专利技术属性】
技术研发人员:卡罗来纳·加列吉略斯,
申请(专利权)人:惠普发展公司,有限责任合伙企业,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。