【技术实现步骤摘要】
一种基于预分类的古籍数学符号识别方法
[0001]本专利技术属于图像识别
,特别是涉及一种基于预分类的古籍数学符号识别方法。
技术介绍
[0002]在编程语言中,对指定图像中的对象进行辨认的过程称为识别、数学符号识别,是一种根据对象轮廓识别对象符号的程序,用于识别给定图像中印刷体的数学符号。
[0003]现有技术基于Tensorflow的自定义对象数学符号检测模型的训练是通过输入带有数学符号、字母和数字的数据集,利用TensorFlow对象检测技术,进行反复的训练,直到准确率达到100%,将结果集存储起来,并作为输入,从而创建出一个新模型,即数学符号识别模型,但该模型获取的准确度不超过65%。需手动收集不同的手写符号,并对收集到的符号进行训练和测试,这需用到高速处理器及更多内存,来提高准确率。这个过程相当复杂。要利用复杂的神经网络技术,以及复杂的内部操作。
[0004]故引入一项新技术,这种新兴技术用于识别或检测图像中印刷体的数学符号,它是一种改进的形状检测技术,本方案所使用的编程技术简单易懂,成本较低 ...
【技术保护点】
【技术特征摘要】
1.一种基于预分类的古籍数学符号识别方法,包括分类阶段和识别阶段,其特征在于,分类阶段的具体步骤如下:步骤F1:向模板库输入大量的古籍数学符号图像集;步骤F2:提取模板库中所有图像的SIFT特征;步骤F3:使用BoW模型视觉符号向量重新表示SIFT特征;步骤F4:将向量输入到SVM中进行训练,得到分类器的各项参数和图像分类结果;识别阶段的具体步骤如下:步骤S1:输入待识别的古籍数学符号;步骤S2:提取待识别古籍数学符号的SIFT特征;步骤S3:使用BoW模型视觉符号向量表示图像特征;步骤S4:输入训练好的SVM进行分类;步骤S5:获取待识别图像所属的预分类图像集;步骤S6:对图像特征进行RANSAC提纯匹配操作;步骤S7:输出匹配率最高的那幅匹配图像作为识别结果。2.根据权利要求1所述的一种基于预分类的古籍数学符号识别方法,其特征在于,所述步骤F3中,BoW模型重新表示SIFT特征的具体流程如下:步骤F31:特征提取、提取给定模板图像库中M幅图像的SIFT特征,共N个SIFT特征;步骤F32:聚类特征、使用K
‑
Means聚类算法通过对N个特征向量聚类,得到k个聚类中心;步骤F33:图像特征表示,计算每幅图像每个特征到这k个聚类中心的距离,并将其映射到离它最近的聚类中心中,将该聚类中心对应的词频加1,最终每幅图像用一个词频向量来表示。3.根据权利要求1所述的一种基于预分类的古籍数学符号识别方法,其特征在于,所述步骤F4中,SVM进行训练的具体流程如下:步骤F41:选择图像库中的k类目标,随机选取每种类别图幅号中的X幅用于训练,剩余的Y幅图像用于测试;步骤F42:对训练样本图像使用SIFT算法提取图像特征,紧接着利用BoW模型表示图像特征,把同一类别的特征向量归为一类,得到k类特征向量;步骤F43:将k类特征向量任意两两组合分别输入支持向量机中学习训练,从而得到个分类器判别先后顺序;步骤F44:使用SIFT算法提取测试样本图像的特征向量,并利用BoW模型重新描述,然后输入训练好的SVM起始分类器,根据OAO方法的判别结果依次输入下个分类器进行判别,直到最终得到图像的分类识别结果。4.根据权利要求1所述的一种基于预分类的古籍数学符号识别方法,其特征在于,所述步骤S1中,对输入的待识别的古籍数学符号进行预处理,具体处理步骤如下:步...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。