一种图像处理方法和装置制造方法及图纸

技术编号:20005169 阅读:49 留言:0更新日期:2019-01-05 17:46
本发明专利技术实施例提供了一种图像处理方法和装置,其中,所述方法包括:获取手写字符对应的原始图像;采用文本识别模型对所述原始图像中的手写字符进行着色处理,得到对应的彩色图像;确定所述彩色图像中彩色字符对应的色彩信息,其中,所述色彩信息用于表征手写字符笔画的书写方向;依据所述彩色字符对应的色彩信息,识别所述原始图像中的手写字符;能够提高脱机识别手写字符的准确性。

An Image Processing Method and Device

The embodiment of the present invention provides an image processing method and device, in which the method includes: acquiring the original image corresponding to handwritten characters; coloring the handwritten characters in the original image using a text recognition model to obtain the corresponding color image; and determining the color information corresponding to the color characters in the color image, in which the color information is used for tables. The writing direction of signature strokes, the recognition of handwritten characters in the original image based on the corresponding color information of the color characters, and the accuracy of offline recognition of handwritten characters can be improved.

【技术实现步骤摘要】
一种图像处理方法和装置
本专利技术涉及数据处理
,特别是涉及一种图像处理方法和装置。
技术介绍
目前,手写文字识别的方式可包括两种:联机手写文字识别和脱机手写文字识别。其中,联机手写文字识别即用户一边在输入设备如手写板上书写,计算机一边记录书写轨迹,然后依据记录的轨迹识别用户输写的文字;而脱机手写文字识别是即对手写文档扫描,然后对扫描的图像进行预处理、特征提取、模式分类以及识别后处理等系列操作,来识别手写文字。其中,汉字种类多、字形结构复杂、相似的文字较多,且不同人书写风格不同,这给脱机手写文字识别过程中模式分类上带来了困难,导致脱机手写文字识别的准确率低。
技术实现思路
本专利技术实施例所要解决的技术问题是提供一种图像处理方法,以提高脱机识别字符的准确性。相应的,本专利技术实施例还提供了一种图像处理装置,用以保证上述方法的实现及应用。为了解决上述问题,本专利技术实施例公开了一种图像处理方法,具体包括:获取手写字符对应的原始图像;采用文本识别模型对所述原始图像中的手写字符进行着色处理,得到对应的彩色图像;确定所述彩色图像中彩色字符对应的色彩信息,其中,所述色彩信息用于表征手写字符笔画的书写方向;依据所述彩色字符对应的色彩信息,识别所述原始图像中的手写字符。本专利技术实施例还公开了一种图像处理装置,具体包括:图像获取模块,用于获取手写字符对应的原始图像;着色处理模块,用于采用文本识别模型对所述原始图像中的手写字符进行着色处理,得到对应的彩色图像;信息确定模块,用于确定所述彩色图像中彩色字符对应的色彩信息,其中,所述色彩信息用于表征手写字符笔画的书写方向;字符识别模块,用于依据所述彩色字符对应的色彩信息,识别所述原始图像中的手写字符。与现有技术相比,本专利技术实施例包括以下优点:本专利技术实施例可在获取手写字符对应的原始图像后,采用文本识别模型为原始图像中手写字符进行着色,其中,手写字符笔画书写方向不同时,对应填充的颜色不同;进而使得着色后得到的彩色图像中,彩色字符的色彩信息能够体现笔画的书写方向,从而依据彩色字符的色彩信息识别手写字符,能够提高脱机识别手写字符的准确性。附图说明图1是本专利技术的一种图像处理方法实施例的步骤流程图;图2a是本专利技术实施例的一种原始图像的示意图;图2b是本专利技术实施例的一种彩色图像的示意图;图3是本专利技术一种训练文本识别图像实施例的步骤流程图;图4是本专利技术一种图像处理方法可选实施例的步骤流程图;图5是本专利技术实施例的另一种彩色图像的示意图;图6是本专利技术的一种图像处理装置实施例的结构框图;图7是本专利技术的一种图像处理装置可选实施例的结构框图。具体实施方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。本专利技术实施例的核心构思之一在于,获取手写字符对应的原始图像后,可采用文本识别模型为原始图像中手写字符进行着色,其中,手写字符笔画书写方向不同时,对应填充的颜色不同;进而使得着色后得到的彩色图像中,彩色字符的色彩信息能够体现笔画的书写方向,从而依据彩色字符的色彩信息识别手写字符,能够提高识别手写字符的准确性。参照图1,示出了本专利技术的一种图像处理方法实施例的步骤流程图,具体可以包括如下步骤:步骤101、获取手写字符对应的原始图像。本专利技术实施例可对手写字符进行脱机识别,因此针对待识别的手写字符,可获取该手写字符对应的原始图像;例如可以采用光学仪器获取手写字符的原始图像,如采用扫描仪扫描手写字符,采用传真机复印手写字符,采用摄影器材进行拍摄等等。然后再按照步骤102-步骤104,对原始图像中的手写字符进行识别:步骤102、采用文本识别模型对所述原始图像中的手写字符进行着色处理,得到对应的彩色图像。本专利技术实施例中,可预先采用训练图像对文本识别模型进行训练,所述训练图像可以包括各种手写字符的彩色训练图像,其中,所述彩色训练图像中的字符是手写字符着色后的字符,该字符每个笔画的颜色可以与其书写方向相关;例如,笔画“丶”的书写方向是与水平线成315度的夹角,可对应红色,笔画“ノ”的书写方向是与水平线成45度的夹角,可对应绿色,笔画“丿”其书写方向包括多个,如上半部分书写与水平向成90度夹角,可对应红色,下半部分书写方向与水平方向呈225度角度,可对应橙色等等。进而在识别过程中,在获取手写字符的原始图像后,可采用文本识别模型能够对该原始图像进行着色处理,得到该手写字符对应的彩色图像。其中,采用文本识别模型对原始图像进行着色处理,可以是指对原始图像中的手写字符进行着色,进而可得到具有彩色字符的图像即彩色图像;然后再依据所述彩色图像识别该手写字符。其中,在后续的实施例中再对训练文本识别模型的过程进行说明。步骤103、确定所述彩色图像中彩色字符对应的色彩信息,其中,所述色彩信息用于表征手写字符笔画的书写方向。步骤104、依据所述彩色字符对应的色彩信息,识别所述原始图像中的手写字符。相应的,所述彩色字符对应的颜色,也可以反映原始图像中手写字符笔画的书写方向;因此在确定彩色图像后,可确定所述彩色图像中彩色字符对应的色彩信息,所述色彩信息可以包括与色彩相关的信息,如彩色字符的颜色信息、彩色字符对应的位置信息如彩色字符对应的所有像素点坐标信息等等。然后再依据所述彩色字符对应的色彩信息,确定原始图像中的手写字符,进而实现了对手写字符的脱机识别。本专利技术一个示例中,可获取手写字符“啊”的原始图像如图2a所示,然后采用文本识别模型对图2a中“啊”进行着色,即彩色图形中“啊”被填充为彩色,得到彩色图像,如图2b所示;图2b中“啊”各笔画中不同灰度表征不同颜色。然后依据彩色字符“啊”对应的色彩信息,对原始图像中的手写字符进行识别,可确定图2a中手写字符为“啊”。综上,本专利技术实施例可在获取手写字符对应的原始图像后,采用文本识别模型为原始图像中手写字符进行着色,其中,手写字符笔画书写方向不同时,对应填充的颜色不同;进而使得着色后得到的彩色图像中,彩色字符的色彩信息能够体现笔画的书写方向,从而依据彩色字符的色彩信息识别手写字符,能够提高脱机识别手写字符的准确性。本专利技术的另一个实施例中,可收集训练图像,然后采用训练图像对文本识别模型进行训练,进而使得训练后的文本识别模型可准确的对原始图像中的手写字符进行着色。其中,所述文本识别模型可包括生成对抗模型(GAN,GenerativeAdversarialNetworks),所述GAN模型可包括两个部分:生成模型(后续称为G模型)和对抗模型(后续称为D模型);其中,对文本识别模型的训练可包括两部分:对G模型的训练和对D模型的训练。参照图3,示出了本专利技术一种训练文本识别图像实施例的步骤流程图,具体包括如下步骤:步骤301、获取训练图像,所述训练图像包括:手写字符对应的灰度图像和彩色训练图像。本专利技术实施例中,可获取训练图像,以采用训练图像对GAN模型进行训练;其中,所述训练图像可包括两部分:手写字符的灰度图像和手写字符的彩色训练图像。所述灰度图像可以是手写字符的扫描图像、复印图像、照片等等,本专利技术实施例对此不作限制,然后采用该灰度图像对G模型进行训练;其中,同一个字符可对应多个用户书写的手写字符。针对每个手写字符,可确定该手写字符对应的彩色训练图像,以采用所述彩色本文档来自技高网...

【技术保护点】
1.一种图像处理方法,其特征在于,包括:获取手写字符对应的原始图像;采用文本识别模型对所述原始图像中的手写字符进行着色处理,得到对应的彩色图像;确定所述彩色图像中彩色字符对应的色彩信息,其中,所述色彩信息用于表征手写字符笔画的书写方向;依据所述彩色字符对应的色彩信息,识别所述原始图像中的手写字符。

【技术特征摘要】
1.一种图像处理方法,其特征在于,包括:获取手写字符对应的原始图像;采用文本识别模型对所述原始图像中的手写字符进行着色处理,得到对应的彩色图像;确定所述彩色图像中彩色字符对应的色彩信息,其中,所述色彩信息用于表征手写字符笔画的书写方向;依据所述彩色字符对应的色彩信息,识别所述原始图像中的手写字符。2.根据权利要求1所述的方法,其特征在于,所述依据所述彩色字符对应的色彩信息,识别所述原始图像对应的手写字符,包括:依据所述彩色字符对应的色彩信息,确定所述彩色字符对应坐标点序列集合,其中,所述坐标点序列集合包括至少一组坐标点序列;确定所述坐标点序列集合中各组坐标点序列对应的笔画,采用各组坐标点序列的笔画组成所述彩色字符的笔画串;将所述彩色字符对应的笔画串与数据库中各字符的笔画串进行匹配,确定所述手写字符是所述匹配的笔画串对应字符。3.根据权利要求1所述的方法,其特征在于,所述依据所述彩色图像中彩色字符对应的色彩信息,识别所述原始图像对应的手写字符,包括:依据所述彩色字符对应的色彩信息,提取所述彩色图像对应的特征;依据提取的特征对所述彩色图像进行分类;对所述分类的结果进行后处理,依据所述后处理结果识别所述原始图像对应的手写字符。4.根据权利要求1所述的方法,其特征在于,所述文本识别模型包括生成式对抗模型,所述生成式对抗模型包括:生成模型和判别模型;所述方法还包括训练文本识别模型的步骤:获取训练图像,所述训练图像包括:手写字符对应的灰度图像和彩色训练图像;采用所述灰度图像对所述生成模型进行训练;以及采用所述彩色训练图像和所述生成模型生成的彩色图像对所述判别模型进行训练。5.根据权利要求4所述的方法,其特征在于,所述方法还包括生成手写字符对应彩色训练图像的步骤:获取手写字符对应的坐标点序列集合,依据所述坐标点序列集合生成所述手写字符对应的基础图像;针对所述基础图像中手写字符的每个笔画,确定所述笔画的各线段对应的书写方向;依据所述书写方向和映射信息,确定各线段对应的填充颜色;针对所述基础图像中字符的各个线段,采用所述线段对应的填充颜色进行填充,得到彩色训练...

【专利技术属性】
技术研发人员:李健高大帅伍更新
申请(专利权)人:北京捷通华声科技股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1