一种基于无监督学习的手写体图像识别方法及系统技术方案

技术编号:26971579 阅读:39 留言:0更新日期:2021-01-06 00:02
本发明专利技术属于图像识别技术领域,涉及一种基于无监督学习的手写体图像识别方法及系统,包括以下步骤:S1对图像进行预处理,获得图像的二值化矩阵;S2将二值化矩阵在水平、垂直和倾斜方向进行特征值提取,并获得水平、垂直和倾斜方向的特征向量;S3将水平、垂直和倾斜方向的特征向量融合成一个特征向量;S4利用机器学习模型对经过融合后的特征向量进行训练,得到图像分类模型;S5将待测手写体图像输入图像分类模型,获得识别结果。其充分考虑到了手写体文字的基本特征,即横竖撇捺四个方向的笔画,有助于更好读取手写体文字的内容,为其他垂直领域的图像特征构建提供可借鉴的思路。

【技术实现步骤摘要】
一种基于无监督学习的手写体图像识别方法及系统
本专利技术涉及一种基于无监督学习的手写体图像识别方法及系统,属于图像识别

技术介绍
手写体识别过程往往是通过机器识别图像中的手写体,即将人们手写的内容通过扫描、拍照等方式转换成电子图像形式进行分析处理。在这个过程中,主要涉及对图像特征的提取和融合。图像特征提取是计算机图像处理中的一个基本概念,指的通过计算机提取图像信息,决定每个图像的点是否属于一个图像特征。其最终结果是将图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。图像特征可以从图像的边缘、角、区域、脊等角度进行提取和表示。当前,常用的图像特征有颜色特征、纹理特征、形状特征和空间关系特征。从应用价值上看,手写体识别研究对人机交互领域和文字信息自动处理领域具有重要实际价值。在人机交互领域,可以提高人机交互的自然性友好性,是未来智能人机接口的重要组成部分。在文字信息自动处理领域,可以节省人力,提高工作效率,加快信息流动,适应信息时代的要求。同时,对基于摄像机或数码相机的视频图像的文字识别,证件防伪术中的文字识别本文档来自技高网...

【技术保护点】
1.一种基于无监督学习的手写体图像识别方法,其特征在于,包括以下步骤:/nS1对图像进行预处理,获得所述图像的二值化矩阵;/nS2将所述二值化矩阵在水平、垂直和倾斜方向进行特征值提取,并获得水平、垂直和倾斜方向的特征向量;/nS3将所述水平、垂直和倾斜方向的特征向量融合成一个特征向量;/nS4利用机器学习模型对经过融合后的特征向量进行训练,得到图像分类模型;/nS5将待测手写体图像输入所述图像分类模型,获得识别结果。/n

【技术特征摘要】
1.一种基于无监督学习的手写体图像识别方法,其特征在于,包括以下步骤:
S1对图像进行预处理,获得所述图像的二值化矩阵;
S2将所述二值化矩阵在水平、垂直和倾斜方向进行特征值提取,并获得水平、垂直和倾斜方向的特征向量;
S3将所述水平、垂直和倾斜方向的特征向量融合成一个特征向量;
S4利用机器学习模型对经过融合后的特征向量进行训练,得到图像分类模型;
S5将待测手写体图像输入所述图像分类模型,获得识别结果。


2.如权利要求1所述的基于无监督学习的手写体图像识别方法,其特征在于,所述S1中的预处理方法为:首先对彩色图像进行灰度化处理,生成灰度图像,再将所述灰度化图像进行二值化处理,从而得到与所述图像对应的二值化矩阵。


3.如权利要求2所述的基于无监督学习的手写体图像识别方法,其特征在于,所述二值化处理方法为:将所述灰度化图像中灰度大于阈值的像素点用1表示,灰度小于阈值的用0表示。


4.如权利要求1所述的基于无监督学习的手写体图像识别方法,其特征在于,所述步骤S2中水平、垂直方向获得特征向量的方法为:对于所述二值化矩阵,通过在水平方向进行列相加,提取图片水平特征向量;通过在垂直方向进行列相加,并对经过垂直方向列相加后获得的矩阵进行转置,得到垂直特征向量。


5.如权利要求4所述的基于无监督学习的手写体图像识别方法,其特征在于,所述步骤S2中倾斜方向获得特征向量的方法为:对于所述二值化矩阵,沿倾斜方向对所述二值化矩阵中的向量进行叠加,得到一个...

【专利技术属性】
技术研发人员:梁循张树森薛扬付虹蛟
申请(专利权)人:中国人民大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1