一种基于预分类的古籍数学符号识别方法技术

技术编号：37986559 阅读：20 留言：0更新日期：2023-06-30 10:01

本发明专利技术公开了一种基于预分类的古籍数学符号识别方法，涉及图像识别技术领域。本发明专利技术包括分类和识别两个阶段；分类阶段：提取古籍数学符号图像集的SIFT特征，进行SVM训练；识别阶段：输入待识别的古籍数学符号，提取SIFT特征，使用BoW模型视觉符号向量表示图像特征；输入训练好的SVM进行分类；获取待识别图像所属的预分类图像集；对图像特征进行RANSAC提纯匹配操作；输出匹配率最高的那幅匹配图像作为识别结果。本发明专利技术通过获取大量古籍数学符号来训练SVM分类器，并将待识别的古籍数学符号输入训练好的SVM进行分类后，进行RANSAC提纯匹配操作，输出匹配率最高的那幅匹配图像作为识别结果，提高了古籍数学符号识别准确率。提高了古籍数学符号识别准确率。提高了古籍数学符号识别准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于预分类的古籍数学符号识别方法

[0001]本专利技术属于图像识别
，特别是涉及一种基于预分类的古籍数学符号识别方法。

技术介绍

[0002]在编程语言中，对指定图像中的对象进行辨认的过程称为识别、数学符号识别，是一种根据对象轮廓识别对象符号的程序,用于识别给定图像中印刷体的数学符号。
[0003]现有技术基于Tensorflow的自定义对象数学符号检测模型的训练是通过输入带有数学符号、字母和数字的数据集，利用TensorFlow对象检测技术，进行反复的训练，直到准确率达到100％，将结果集存储起来，并作为输入，从而创建出一个新模型，即数学符号识别模型，但该模型获取的准确度不超过65％。需手动收集不同的手写符号，并对收集到的符号进行训练和测试，这需用到高速处理器及更多内存，来提高准确率。这个过程相当复杂。要利用复杂的神经网络技术，以及复杂的内部操作。
[0004]故引入一项新技术，这种新兴技术用于识别或检测图像中印刷体的数学符号，它是一种改进的形状检测技术，本方案所使用的编程技术简单易懂，成本较低...

【技术保护点】

【技术特征摘要】
1.一种基于预分类的古籍数学符号识别方法，包括分类阶段和识别阶段，其特征在于，分类阶段的具体步骤如下：步骤F1：向模板库输入大量的古籍数学符号图像集；步骤F2：提取模板库中所有图像的SIFT特征；步骤F3：使用BoW模型视觉符号向量重新表示SIFT特征；步骤F4：将向量输入到SVM中进行训练，得到分类器的各项参数和图像分类结果；识别阶段的具体步骤如下：步骤S1：输入待识别的古籍数学符号；步骤S2：提取待识别古籍数学符号的SIFT特征；步骤S3：使用BoW模型视觉符号向量表示图像特征；步骤S4：输入训练好的SVM进行分类；步骤S5：获取待识别图像所属的预分类图像集；步骤S6：对图像特征进行RANSAC提纯匹配操作；步骤S7：输出匹配率最高的那幅匹配图像作为识别结果。2.根据权利要求1所述的一种基于预分类的古籍数学符号识别方法，其特征在于，所述步骤F3中，BoW模型重新表示SIFT特征的具体流程如下：步骤F31：特征提取、提取给定模板图像库中M幅图像的SIFT特征，共N个SIFT特征；步骤F32：聚类特征、使用K
‑
Means聚类算法通过对N个特征向量聚类，得到k个聚类中心；步骤F33：图像特征表示，计算每幅图像每个特征到这k个聚类中心的距离，并将其映射到离它最近的聚类中心中，将该聚类中心对应的词频加1，最终每幅图像用一个词频向量来表示。3.根据权利要求1所述的一种基于预分类的古籍数学符号识别方法，其特征在于，所述步骤F4中，SVM进行训练的具体流程如下：步骤F41：选择图像库中的k类目标，随机选取每种类别图幅号中的X幅用于训练，剩余的Y幅图像用于测试；步骤F42：对训练样本图像使用SIFT算法提取图像特征，紧接着利用BoW模型表示图像特征，把同一类别的特征向量归为一类，得到k类特征向量；步骤F43：将k类特征向量任意两两组合分别输入支持向量机中学习训练，从而得到个分类器判别先后顺序；步骤F44：使用SIFT算法提取测试样本图像的特征向量，并利用BoW模型重新描述，然后输入训练好的SVM起始分类器，根据OAO方法的判别结果依次输入下个分类器进行判别，直到最终得到图像的分类识别结果。4.根据权利要求1所述的一种基于预分类的古籍数学符号识别方法，其特征在于，所述步骤S1中，对输入的待识别的古籍数学符号进行预处理，具体处理步骤如下：步...

【专利技术属性】
技术研发人员：董杰，高峰，王鑫义，杨承，
申请(专利权)人：内蒙古师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人