【技术实现步骤摘要】
一种基于图像处理技术的样本增广方法、系统及介质
[0001]本专利技术涉及手写字符识别
,特别是涉及一种基于图像处理技术的样本增广方法、系统及介质。
技术介绍
[0002]现有技术中,对于手写字符样本训练集的扩充方法常通过对手写样本进行模糊或平移等变化来增加手写字符样本训练集中字符样本的数量,这种方法一方面不会对录入的手写样本进行筛查,进而会生成大量的无效样本,另一方面因每个人的手写习惯不同,手写字符样本的多样性较高,故仅仅通过模糊或平移同样无法生成有效的手写字符样本,进而降低了字符样本训练集的适用性。
技术实现思路
[0003]本专利技术主要解决的是现有技术中对于手写字符样本训练集的扩充方法无法生成有效的手写字符样本,进而降低了字符样本训练集的适用性的问题。
[0004]为解决上述技术问题,本专利技术采用的一个技术方案是:提供一种基于图像处理技术的样本增广方法,包括以下步骤:
[0005]样本采集步骤:
[0006]配置下载程序、图像捕捉模块和样本存放容器;设置基准色彩值;基于 ...
【技术保护点】
【技术特征摘要】
1.一种基于图像处理技术的样本增广方法,其特征在于,包括以下步骤:样本采集步骤:配置下载程序、图像捕捉模块和样本存放容器;设置基准色彩值;基于所述下载程序、所述图像捕捉模块、所述样本存放容器和所述基准色彩值创建字符手写样本集;样本区分步骤:配置二值化算法和形状集合表;设置占比值区间和第一色彩;基于所述字符手写样本集、所述二值化算法、所述形状集合表、所述占比值区间和所述第一色彩设定非中文字符样本和中文字符样本;样本扩充步骤:配置样本处理方案;基于所述样本处理方案对所述非中文字符样本和所述中文字符样本执行样本增广操作,得到增广样本集。2.根据权利要求1所述的一种基于图像处理技术的样本增广方法,其特征在于,所述基于所述下载程序、所述图像捕捉模块、所述样本存放容器和所述基准色彩值创建字符手写样本集的步骤进一步包括:调用所述下载程序下载若干第一字符样本;调用所述图像捕捉模块捕捉若干第二字符样本;对若干所述第一字符样本和若干所述第二字符样本执行第一图像处理操作,得到若干第三字符样本;将若干所述第三字符样本置入所述样本存放容器中,得到所述字符手写样本集。3.根据权利要求2所述的一种基于图像处理技术的样本增广方法,其特征在于,所述第一图像处理操作包括:检测若干所述第一字符样本的若干第一色彩值以及若干所述第二字符样本的若干第二色彩值;设定与所述基准色彩值相匹配的所述第一色彩值和所述第二色彩值分别对应的所述第一字符样本和所述第二字符样本均为第一达标样本;设定若干所述第一字符样本和若干所述第二字符样本中除所述第一达标样本外的所述第一字符样本和所述第二字符样本均为未达标样本;对所述未达标样本进行去色处理,直至所述未达标样本的第三色彩值与所述基准色彩值相匹配,则得到第二达标样本;设定所述第一达标样本和所述第二达标样本均为所述第三字符样本。4.根据权利要求3所述的一种基于图像处理技术的样本增广方法,其特征在于,所述形状集合表中配置有若干字符形状;所述基于所述字符手写样本集、所述二值化算法、所述形状集合表、所述占比值区间和所述第一色彩设定非中文字符样本和中文字符样本的步骤进一步包括:调用所述二值化算法对若干所述第三字符样本进行二值化处理,得到若干待区分字符样本;识别所述待区分字符样本的第一形状以及所述待区分字符样本中对于所述第一色彩的第一占比值;判断所述形状集合表中是否存在与所述第一形状相匹配的字符形状,若存在,则判断所述第一占比值是否位于所述占比值区间内,若处于,则设定该待区分字符样本为所述非中文字符样本;设定若干所述待区分字符样本中除所述非中文字符样本外的所述待区分字符样本均为所述中文字符样本。
5.根据权利要求4所述的一种基于图像处理技术的样本增广方法,其特征在于,所述配置样本处理方案的步骤进一步包括:配置第一方案模板和第二方案模板;设置与所述中文字符样本和所述非中文字符样本分别匹配的第一处理信息和第二处理信息;将所述第一处理信息填充至所述第一方案模板中...
【专利技术属性】
技术研发人员:张涛,索春宝,胡焱,牛鹏,
申请(专利权)人:浪潮金融信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。