基于区块链机制的OCR深度学习方法、存储介质技术

技术编号:20364293 阅读:24 留言:0更新日期:2019-02-16 17:09
本发明专利技术提供基于区块链机制的OCR深度学习方法、存储介质,方法包括:依据学习数据创建由各状态及其对应的当下回报构成的模型,所述各状态对应学习数据中各子学习数据;私有存储模型至区块链网络的各节点;随机挑选模型中的状态进行训练,并获取状态对应的新回报;依据所述新回报优化模型,获取对应所述模型的训练模型;依据数量足够多的模型对应的训练模型集进行卷积深度学习;共享存储卷积深度学习的结果至各节点。本发明专利技术可以实现学习数据的资源共享;可以对自我学习成果进行有效保护,提高学习价值,同时有助于加快研发进度;还可以保证用户数据隐私性。

【技术实现步骤摘要】
基于区块链机制的OCR深度学习方法、存储介质
本专利技术涉及OCR深度学习方法,具体涉及基于区块链机制的OCR深度学习方法、存储介质。
技术介绍
目前常见的OCR方案是基于滑动窗口全图扫描的自上而下的方式和基于底层规则先分割得到小区域再组合成文字区域的自底而上的方式。而OCR的深度学习则是基于HOG特征输入的5层CNN网络作为OCR识别模型。在识别网络训练中,CNN要识别复杂的文字,面临的问题就是如何获取足够多的符合多样性的训练样本,而只有训练的样本满足多样性才能保证训练出符合业务需求的OCR识别网络。传统的文字识别是采用基于模板匹配的方式,对特征描述要求较高,很难满足复杂环境下的识别,目前深度学习是基于CNN网络的学习,是独立进行的。每次学习都需要庞大且多样的数据样本,包括字体、颜色、背景等。据现有的产品来看,对于手写体的识别率并没有达到印刷体识别率的稳定性。阻碍手写识别最大的问题就是识别样本数据不足,使得在5层CNN网络中机器的学习没有达到要求。而目前的艺术字、个性签名等字体越来越多,对于OCR来说,需要不断的对新的字体进行学习。而每多一种字体,仅以汉字为例就多了上万种文字,就需要大量的学习时间。那么通过区块链的数据共享特征可以解决这一问题。对于新数据的学习,各个公司都在比速度,对于OCR来说,CNN并不是难题,关键在于谁更快的对新文字进行识别学习,而通过区块链对数据的私有保护特性,能在状态和状态对应的回报选取、固定模型阶段保护私有数据。OCR的识别应用慢慢更多转向了金融行业,不论是票据、数字签名,都具有一定的私有性,而OCR识别后,只会确定文字内容,并不会对文字作保护。那么通过区块链的私有数据机制和确权属性便可以对数据行保护。
技术实现思路
本专利技术所要解决的技术问题是:提供基于区块链机制的OCR深度学习方法、存储介质,不仅大大减少学习时间;同时还能将训练模型私有化保护,提高学习价值。为了解决上述技术问题,本专利技术采用的技术方案为:基于区块链机制的OCR深度学习方法,包括:依据学习数据创建由各状态及其对应的当下回报构成的模型,所述各状态对应学习数据中各子学习数据;私有存储模型至区块链网络的各节点;随机挑选模型中的状态进行训练,并获取状态对应的新回报;依据所述新回报优化模型,获取对应所述模型的训练模型;依据数量足够多的模型对应的训练模型集进行卷积深度学习;共享存储卷积深度学习的结果至各节点。本专利技术提供的另一个技术方案为:一种计算机可读存储介质,其上存储有计算机程序,所述程序在被处理器处理时,能实现上述基于区块链机制的OCR深度学习方法所包含的步骤。本专利技术的有益效果在于:首先,通过区块链的数据共享特征,不仅能够保证OCR识别数据可以被所有机器进行复用,而且还能依据共享数据显著提升学习效率,从而大大缩减学习时间;其次,通过区块链的私有保护和确权属性,不仅能够在获取训练模型阶段保证训练模型的私有性,有助于快速研发,提高企业价值;而且在识别存储数据阶段,还能保证用户数据隐私。附图说明图1为本专利技术基于区块链机制的OCR深度学习方法的流程示意图;图2为本专利技术实施例一的流程示意图。具体实施方式为详细说明本专利技术的
技术实现思路
、所实现目的及效果,以下结合实施方式并配合附图予以说明。本专利技术最关键的构思在于:通过区块链的数据共享特征,保证被学习数据可以被所有机器复用;通过区块链的私有保护和确权属性,在训练模型阶段,保证产品私有性,有助于快速研发,提高企业价值;而且在识别存储数据阶段,还能保证用户数据隐私。本专利技术涉及的技术术语解释:技术术语解释OCR深度学习手写识别的自我学习能力区块链机制基于区块链网络的存储特性状态深度学习时传递的动作数据状态对应的回报动作发生后产生的结果数据模型希望达到的结果训练模型优化后的模型,即深度学习数据卷积深度学习通过卷积神经网络进行自我学习固定模型固定目标,防止学习过程发生抖动CNN卷积神经网络请参照图1,本专利技术提供基于区块链机制的OCR深度学习方法,包括:依据学习数据创建由各状态及其对应的当下回报构成的模型,所述各状态对应学习数据中各子学习数据;私有存储模型至区块链网络的各节点;随机挑选模型中的状态进行训练,并获取状态对应的新回报;依据所述新回报优化模型,获取对应所述模型的训练模型,并将其私有存储至各节点;依据数量足够多的模型对应的训练模型集进行卷积深度学习;共享存储卷积深度学习的结果至各节点。从上述描述可知,本专利技术的有益效果在于:通过本申请进行新字体的OCR深度学习及识别,通过区块链存储的私有属性,首先可以保证所选取的学习数据的训练模型得以私有化保存,防止商业间谍;其次将学习数据存储于区块链网络中,只要满足单种字体的所有笔画学习,即可通过区块链网络平台的共享性将笔画组合成字体,无需对文字全部进行识别,大大减少所学习的时长。进一步的,所述获取对应所述模型的训练模型,具体为:固定优化后的模型,以固定后的模型作为所述模型的训练模型。由上述描述可知,通过将模型固定,防止训练时出现诸如抖动等问题,从而提高训练的稳定性和准确性。进一步的,还包括:共享存储OCR识别数据至区块链网络的各节点。由上述描述可知,利用区块链的共享机制,实现OCR识别数据的资源共享,以减少OCR识别的学习时间。进一步的,所述依据学习数据创建由各状态及其对应的当下回报构成的模型,所述各状态对应学习数据中各子学习数据,具体为:从OCR识别数据中选取一单字的学习数据;从所述学习数据中随机选取预设个数的子学习数据作为状态,学习结果作为状态对应的当下回报,创建由多个状态及其各自对应的当下回报构成的与所述一单字对应的模型。由上述描述可知,对应单字创建模型,并优化得到单个训练模型。在模型(单字)总数量足够多,足以覆盖该类字体所有笔画特征的情况下,便可只需通过对这些模型的深度学习,即可轻松、快速、准确地掌握这类字体的识别方法,而无需对所有的识别数据都进行学习,从而大大减少学习时间。进一步的,所述依据数量足够多的模型对应的训练模型集进行卷积深度学习,具体为:依据覆盖字体所有笔画特征的多个模型对应的训练模型集,通过5层卷积神经网络进行OCR深度学习。由上述描述可知,只需确保训练模型集能覆盖目标字体的所有笔画特征,便可通过深度学习掌握该类字体的识别方式,而无需对所有的识别数据都进行学习,不仅显著提升了学习效率,减少学习时间,而且又能保证学习的准确性。同时,在一具体实施方式中,通过5层CNN来保证学习的准确性。进一步的,所述依据所述新回报优化模型,具体为:通过bellman方程动态优化模型,获取由最接近模型的状态及其对应的回报构成的训练模型。由上述描述可知,在一具体实施方式中,通过上述方式优化模型,能高效自动筛选出最优策略,获取训练模型。本专利技术提供的另一个技术方案为:一种计算机可读存储介质,其上存储有计算机程序,所述程序在被处理器处理时,能实现上述基于区块链机制的OCR深度学习方法所包含的步骤。对应本领域普通技术人员可以理解实现上述技术方案中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来实现的,所述的程序可存储于一计算机可读取的存储介质中,该程序在执行时,可包括如上述各方法的流程。其中,所述的存储介质可以是磁盘、光碟、只读存储记忆体(Read本文档来自技高网
...

【技术保护点】
1.基于区块链机制的OCR深度学习方法,其特征在于,包括:依据学习数据创建由各状态及其对应的当下回报构成的模型,所述各状态对应学习数据中各子学习数据;私有存储模型至区块链网络的各节点;随机挑选模型中的状态进行训练,并获取状态对应的新回报;依据所述新回报优化模型,获取对应所述模型的训练模型,并将其私有存储至各节点;依据数量足够多的模型对应的训练模型集进行卷积深度学习;共享存储卷积深度学习的结果至各节点。

【技术特征摘要】
1.基于区块链机制的OCR深度学习方法,其特征在于,包括:依据学习数据创建由各状态及其对应的当下回报构成的模型,所述各状态对应学习数据中各子学习数据;私有存储模型至区块链网络的各节点;随机挑选模型中的状态进行训练,并获取状态对应的新回报;依据所述新回报优化模型,获取对应所述模型的训练模型,并将其私有存储至各节点;依据数量足够多的模型对应的训练模型集进行卷积深度学习;共享存储卷积深度学习的结果至各节点。2.如权利要求1所述的基于区块链机制的OCR深度学习方法,其特征在于,所述获取对应所述模型的训练模型,具体为:固定优化后的模型,以固定后的模型作为所述模型的训练模型。3.如权利要求1所述的基于区块链机制的OCR深度学习方法,其特征在于,还包括:共享存储OCR识别数据至区块链网络的各节点。4.如权利要求1所述的基于区块链机制的OCR深度学习方法,其特征在于,所述依据学习数据创建由各状态及其对应的当下回报构成的模型,所述各...

【专利技术属性】
技术研发人员:刘德建于恩涛陈伟刘萍林剑锋范剑敏林琛
申请(专利权)人:福建天晴在线互动科技有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1