一体化光学字符识别方法和系统技术方案

技术编号:17139081 阅读:23 留言:0更新日期:2018-01-27 14:52
本申请公开了一体化光学字符识别方法和系统。该方法的一具体实施方式包括:接收用户的终端发送的一体化光学字符识别服务获取请求,一体化光学字符识别服务获取请求包括:用户选取的属于用户的与光学字符识别相关的模型的标识、用户从候选操作中选取的操作的标识,候选操作包括:训练操作、预测操作;分布式地对用户选取的属于用户的与光学字符识别相关的模型执行用户选取的操作,得到操作结果,以及存储操作结果。实现了用户无需购买硬件和搭建软件环境的情况下,利用服务器提供的满足各种与光学字符识别相关的需求的硬件资源和搭建的软件环境完成模型的训练、光学字符识别应用的开发等操作,节省了开发成本和提升了便利性。

Integrated optical character recognition method and system

The present application discloses an integrated optical character recognition method and system. One embodiment of the method includes: obtaining integrated optical character recognition request service to send the terminal receives user access, integrated optical character recognition service request includes a user selected users and belongs to the optical character recognition from candidate operation select operations identified by relevant model identification, and candidate operations include: training operation, prediction of operation; distributed user selected users and belongs to the optical character recognition related model execution of user selected operation, operating results, and storage operation results. The user does not need to purchase hardware and software environment, the server provides a variety of optical character recognition and meet the related requirements of hardware and software development environment to build complete operation training, optical character recognition application model, saving development costs and enhance the convenience.

【技术实现步骤摘要】
一体化光学字符识别方法和系统
本申请涉及计算机领域,具体涉及计算机视觉领域,尤其涉及一体化光学字符识别方法和系统。
技术介绍
光学字符识别技术是被广泛应用的人工智能技术。目前,在开发光学字符识别应用时,通常使用光学字符识别开发框架进行开发。然而,由于使用光学字符识别开发框架的用户需要进行采购执行光学字符识别模型的训练计算的硬件资源、需要自行搭建模型训练所需的环境,导致时间成本和人力成本高、开发过程繁琐。
技术实现思路
本申请提供了一体化光学字符识别方法和系统,用于解决上述
技术介绍
部分存在的技术问题。第一方面,本申请提供了一体化光学字符识别方法,该方法包括:接收用户的终端发送的一体化光学字符识别服务获取请求,一体化光学字符识别服务获取请求包括:用户选取的属于用户的与光学字符识别相关的模型的标识、用户从候选操作中选取的操作的标识,候选操作包括:训练操作、预测操作;分布式地对用户选取的属于用户的与光学字符识别相关的模型执行用户选取的操作,得到操作结果,以及存储操作结果。第二方面,本申请提供了一体化光学字符识别系统,该系统包括:接收单元,配置用于接收用户的终端发送的一体化光学字符识别服务获取请求,一体化光学字符识别服务获取请求包括:用户选取的属于用户的与光学字符识别相关的模型的标识、用户从候选操作中选取的操作的标识,候选操作包括:训练操作、预测操作;处理单元,配置用于分布式地对用户选取的属于用户的与光学字符识别相关的模型执行用户选取的操作,得到操作结果,以及存储操作结果。本申请提供的一体化光学字符识别方法和系统,通过接收用户的终端发送的一体化光学字符识别服务获取请求,一体化光学字符识别服务获取请求包括:用户选取的属于用户的与光学字符识别相关的模型的标识、用户从候选操作中选取的操作的标识,候选操作包括:训练操作、预测操作;分布式地对用户选取的属于用户的与光学字符识别相关的模型执行用户选取的操作,得到操作结果,以及存储操作结果。实现了用户无需购买硬件和搭建软件环境的情况下,利用服务器提供的满足各种与光学字符识别相关的需求的硬件资源和搭建的软件环境完成模型的训练、光学字符识别应用的开发等操作,节省了开发成本和提升了使用光学字符识别服务的便利性。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1示出了可以应用于本申请的一体化光学字符识别方法或系统的示例性系统架构;图2示出了根据本申请的一体化光学字符识别方法的一个实施例的流程图;图3示出了适用于本申请的一体化光学字符识别方法的一个示例性架构图;图4示出了根据本申请的一体化光学字符识别系统的一个实施例的结构示意图;图5是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用于本申请的一体化光学字符识别方法或系统的示例性系统架构。如图1所示,系统架构可以包括终端101、102、103,网络104和服务器105。网络104用以在终端101、102、103和服务器105之间提供传输链路的介质。网络104可以包括各种连接类型,例如有线、无线传输链路或者光纤电缆等等。终端101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端101、102、103可以是具有显示屏并且支持网络通信的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。服务器105可以向用户提供满足各种与光学字符识别相关的需求的一体化光学字符识别服务。一体化光学字符识别服务包括向用户提供光学字符识别模型的训练、光学字符识别应用的开发所需的硬件资源和软件环境。终端101、102、103可以安装使用服务器105提供的一体化光学字符识别服务的客户端。终端设备101、102、103可以向服务器105发送光学字符识别服务请求。请参考图2,其示出了根据本申请的一体化光学字符识别方法的一个实施例的流程。本申请实施例所提供的一体化光学字符识别方法可以由服务器(例如图1中的服务器105执行)。该方法包括以下步骤:步骤201,接收用户的终端发送的一体化光学字符识别服务获取请求。在本实施例中,可以由向用户提供一体化光学字符识别服务的服务器接收用户的终端发送的一体化光学字符识别服务获取请求。当用户需要使用光学字符识别服务时,可以由用户的终端向服务器发送一体化光学字符识别服务获取请求。一体化光学字符识别服务获取请求可以包括但不限于包括:用户选取的属于用户的与光学字符识别相关的模型的标识、用户从候选操作中选取的操作的标识,候选操作包括:训练操作、预测操作。与光学字符识别相关的模型的类型可以包括但不限于:CNN(ConvolutionalNeuralNetwork,卷积神经网络)模型、DNN(DeepNeuralNetwork)模型、RESNET(deepResidualNetwork,深度残差网络)模型、HOG(HistogramofOrientedGradient,方向梯度直方图)模型等模型。在本实施例中,用户选取的属于用户的与光学字符识别相关的模型可以为用户使用一体化光学字符识别服务训练过的对应于该用户的与光学字符识别相关的模型,也可以为用户第一次使用一体化光学字符识别服务对其进行训练的模型。用户可以从该用户使用一体化光学字符识别服务训练过的对应于该用户的与光学字符识别相关的多个模型中,选取出与光学字符识别相关的模型,再次进行训练或预测。在本实施例中,在用户需要使用光学字符识别服务服务时,可以首先进行登陆操作。例如,用户的终端可以向服务器发送页面获取请求,服务器向用户的终端返回光学字符识别服务服务的登陆页面。用户可以首先在光学字符识别服务服务的登陆页面上输入用户的账号和密码进行登陆,在登陆成功后,服务器可以向用户发送一体化光学字符识别服务的页面。一体化光学字符识别服务服务的页面包括用户使用一体化光学字符识别服务训练过的属于该用户的与光学字符识别相关的模型、CNN模型、DNN模型、HOG等类型对应的创建按钮、训练数据集对应的按钮。用户可以点击CNN模型、DNN模型、HOG等类型模型对应的创建按钮,创建属于该用户的与光学字符识别相关的模型,将创建的属于该用户的与光学字符识别相关的模型作为用户选取的属于用户的与光学字符识别相关的模型。训练数据集可以包括但不限于:汉字数据集、英文字母数据集、数字数据集、科学计算符号数据集、常用符号数据集。在本实施例中,可以由用户的终端向服务器发送远程登陆请求,在通过服务器的校验之后,实现用户的远程登陆,用户可以在终端输入指令调用服务器的程序。步骤202,分布式地对用户选取的属于用户的与光学字符识别相关的模型执行用户选取的操作,得到操作结果,以及存储操作结果。在本实施例中,在通过步骤201接收用户的终端发送的一体化光学字符识别服务获取本文档来自技高网...
一体化光学字符识别方法和系统

【技术保护点】
一种一体化光学字符识别方法,其特征在于,所述方法包括:接收用户的终端发送的一体化光学字符识别服务获取请求,所述一体化光学字符识别服务获取请求包括:用户选取的属于所述用户的与光学字符识别相关的模型的标识、用户从候选操作中选取的操作的标识,候选操作包括:训练操作、预测操作;分布式地对用户选取的属于所述用户的与光学字符识别相关的模型执行用户选取的操作,得到操作结果,以及存储所述操作结果。

【技术特征摘要】
1.一种一体化光学字符识别方法,其特征在于,所述方法包括:接收用户的终端发送的一体化光学字符识别服务获取请求,所述一体化光学字符识别服务获取请求包括:用户选取的属于所述用户的与光学字符识别相关的模型的标识、用户从候选操作中选取的操作的标识,候选操作包括:训练操作、预测操作;分布式地对用户选取的属于所述用户的与光学字符识别相关的模型执行用户选取的操作,得到操作结果,以及存储所述操作结果。2.根据权利要求1所述的方法,其特征在于,用户从候选操作中选取的操作为训练操作,所述一体化光学字符识别服务获取请求还包括:用户选取的训练数据集的标识;以及分布式地对用户选取的属于所述用户的与光学字符识别相关的模型执行用户选取的操作包括:从分布式文件系统读取所述用户选取的训练数据集的标识对应的训练数据集和所述用户选取的属于所述用户的与光学字符识别相关的模型对应的当前的训练程序;分布式地利用所述当前的训练程序基于所述训练数据集对用户选取的属于所述用户的与光学字符识别相关的模型执行训练操作,得到训练后的用户选取的属于所述用户的与光学字符识别相关的模型和模型参数;将训练后的用户选取的属于所述用户的与光学字符识别相关的模型和模型参数存储在分布式文件系统中。3.根据权利要求1所述的方法,其特征在于,用户从候选操作中选取的操作为预测操作;以及分布式地对用户选取的属于所述用户的与光学字符识别相关的模型执行用户选取的操作包括:从分布式文件系统读取用户选取的属于所述用户的与光学字符识别相关的模型的当前的预测程序;分布式地利用所述当前的预测程序对待预测数据集执行预测操作,得到预测结果;将所述预测结果存储在分布式文件系统中。4.根据权利要求1-3之一所述的方法,其特征在于,所述方法还包括:分别将每一个与光学字符识别的相关的操作封装为应用程序编程接口。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:获取用户基于所述应用程序编程接口编写的光学字符识别应用的代码;建立所述光学字符识别应用与所述用户的用户标识的对应关系。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:获取用户编写的属于所述用户的与光学字符识别相关的模型的训练程序和预测程序的代码;将所述训练程序和预测程序作为所述属于所述用户的与光学...

【专利技术属性】
技术研发人员:许天涵张发恩周恺王倩刘昆肖远昊徐东泽孙家元刘岚
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1