一种基于预分类的古籍数学符号识别方法技术

技术编号:37986559 阅读:20 留言:0更新日期:2023-06-30 10:01
本发明专利技术公开了一种基于预分类的古籍数学符号识别方法,涉及图像识别技术领域。本发明专利技术包括分类和识别两个阶段;分类阶段:提取古籍数学符号图像集的SIFT特征,进行SVM训练;识别阶段:输入待识别的古籍数学符号,提取SIFT特征,使用BoW模型视觉符号向量表示图像特征;输入训练好的SVM进行分类;获取待识别图像所属的预分类图像集;对图像特征进行RANSAC提纯匹配操作;输出匹配率最高的那幅匹配图像作为识别结果。本发明专利技术通过获取大量古籍数学符号来训练SVM分类器,并将待识别的古籍数学符号输入训练好的SVM进行分类后,进行RANSAC提纯匹配操作,输出匹配率最高的那幅匹配图像作为识别结果,提高了古籍数学符号识别准确率。提高了古籍数学符号识别准确率。提高了古籍数学符号识别准确率。

【技术实现步骤摘要】
一种基于预分类的古籍数学符号识别方法


[0001]本专利技术属于图像识别
,特别是涉及一种基于预分类的古籍数学符号识别方法。

技术介绍

[0002]在编程语言中,对指定图像中的对象进行辨认的过程称为识别、数学符号识别,是一种根据对象轮廓识别对象符号的程序,用于识别给定图像中印刷体的数学符号。
[0003]现有技术基于Tensorflow的自定义对象数学符号检测模型的训练是通过输入带有数学符号、字母和数字的数据集,利用TensorFlow对象检测技术,进行反复的训练,直到准确率达到100%,将结果集存储起来,并作为输入,从而创建出一个新模型,即数学符号识别模型,但该模型获取的准确度不超过65%。需手动收集不同的手写符号,并对收集到的符号进行训练和测试,这需用到高速处理器及更多内存,来提高准确率。这个过程相当复杂。要利用复杂的神经网络技术,以及复杂的内部操作。
[0004]故引入一项新技术,这种新兴技术用于识别或检测图像中印刷体的数学符号,它是一种改进的形状检测技术,本方案所使用的编程技术简单易懂,成本较低。无需训练和测试流程本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于预分类的古籍数学符号识别方法,包括分类阶段和识别阶段,其特征在于,分类阶段的具体步骤如下:步骤F1:向模板库输入大量的古籍数学符号图像集;步骤F2:提取模板库中所有图像的SIFT特征;步骤F3:使用BoW模型视觉符号向量重新表示SIFT特征;步骤F4:将向量输入到SVM中进行训练,得到分类器的各项参数和图像分类结果;识别阶段的具体步骤如下:步骤S1:输入待识别的古籍数学符号;步骤S2:提取待识别古籍数学符号的SIFT特征;步骤S3:使用BoW模型视觉符号向量表示图像特征;步骤S4:输入训练好的SVM进行分类;步骤S5:获取待识别图像所属的预分类图像集;步骤S6:对图像特征进行RANSAC提纯匹配操作;步骤S7:输出匹配率最高的那幅匹配图像作为识别结果。2.根据权利要求1所述的一种基于预分类的古籍数学符号识别方法,其特征在于,所述步骤F3中,BoW模型重新表示SIFT特征的具体流程如下:步骤F31:特征提取、提取给定模板图像库中M幅图像的SIFT特征,共N个SIFT特征;步骤F32:聚类特征、使用K

Means聚类算法通过对N个特征向量聚类,得到k个聚类中心;步骤F33:图像特征表示,计算每幅图像每个特征到这k个聚类中心的距离,并将其映射到离它最近的聚类中心中,将该聚类中心对应的词频加1,最终每幅图像用一个词频向量来表示。3.根据权利要求1所述的一种基于预分类的古籍数学符号识别方法,其特征在于,所述步骤F4中,SVM进行训练的具体流程如下:步骤F41:选择图像库中的k类目标,随机选取每种类别图幅号中的X幅用于训练,剩余的Y幅图像用于测试;步骤F42:对训练样本图像使用SIFT算法提取图像特征,紧接着利用BoW模型表示图像特征,把同一类别的特征向量归为一类,得到k类特征向量;步骤F43:将k类特征向量任意两两组合分别输入支持向量机中学习训练,从而得到个分类器判别先后顺序;步骤F44:使用SIFT算法提取测试样本图像的特征向量,并利用BoW模型重新描述,然后输入训练好的SVM起始分类器,根据OAO方法的判别结果依次输入下个分类器进行判别,直到最终得到图像的分类识别结果。4.根据权利要求1所述的一种基于预分类的古籍数学符号识别方法,其特征在于,所述步骤S1中,对输入的待识别的古籍数学符号进行预处理,具体处理步骤如下:步...

【专利技术属性】
技术研发人员:董杰高峰王鑫义杨承
申请(专利权)人:内蒙古师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1