基于词袋模型特征点检索的矢量字符识别方法及系统技术方案

技术编号：33084462 阅读：61 留言：0更新日期：2022-04-15 10:44

本发明专利技术特别涉及一种基于词袋模型特征点检索的矢量字符识别方法，包括如下步骤：S100、针对任一字符矢量图，读取该矢量图数据得到字符轮廓信息；S200、将字符轮廓信息解析成控制点坐标；S300、将控制点坐标绘制成控制点灰度图；S400、根据控制点灰度图提取ORB特征矢量；S500、将ORB特征矢量作为输入，通过词袋树索引从视觉词典中查找相似度最高的字符ID；S600、通过字符ID映射关系得到该矢量字符对应的字体以及unicode编码。通过以上方案，使得矢量图文件不转格式就能直接进行字符识别，同时还具有如下多个优点：其一，字符识别范围大，准确率高，并可扩展到更大的字符集；其二，字符识别速度快，单字识别速度在1.5ms左右；其三，进行字符识别的同时还可以判断字体。符识别的同时还可以判断字体。符识别的同时还可以判断字体。

全部详细技术资料下载

【技术实现步骤摘要】
基于词袋模型特征点检索的矢量字符识别方法及系统

[0001]本专利技术涉及矢量图识别
，特别涉及一种基于词袋模型特征点检索的矢量字符识别方法及系统。

技术介绍

[0002]OCR （Optical Character Recognition，光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；即，针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，并通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技术。如何除错或利用辅助信息提高识别正确率，是OCR最重要的课题，ICR（Intelligent Character Recognition）的名词也因此而产生。衡量一个OCR系统性能好坏的主要指标有：拒识率、误识率、识别速度、用户界面的友好性，产品的稳定性，易用性及可行性等。目前开源的OCR方法中，综合性能最佳的是百度飞桨的PP
‑
OCRv2。
[0003]目前，使用OCR方法进行中文字符识别是主要的字符识别方法，适用的识别对象是位图文件（如bmp、jpg、png等），而对于以矢量路径方式存储字符的矢量图文件（例如svg、ps），需要渲染成位图才能使用OCR方法。同时，现有OCR方法在中文字符覆盖范围、字符识别正确率以及识别速度难以兼具，具有诸多缺点：其一，字符识别范围小，准确率不高，传统的OCR方法字符识别正确率在95%左右；深度学习OCR方法如...

【技术保护点】

【技术特征摘要】
1.一种基于词袋模型特征点检索的矢量字符识别方法，其特征在于：包括如下步骤：S100、针对待检索矢量图文件中任一字符矢量图，读取该矢量图数据得到字符轮廓信息；S200、将字符轮廓信息解析成控制点坐标；S300、将控制点坐标绘制成控制点灰度图；S400、根据控制点灰度图提取ORB特征矢量；S500、将ORB特征矢量作为输入，通过词袋树索引从视觉词典中查找相似度最高的字符ID，视觉词典和词袋树索引是事先根据已有字符的ORB特征矢量通过词袋模型算法构建而成；S600、通过字符ID映射关系得到该矢量字符对应的字体以及unicode编码。2.如权利要求1所述的基于词袋模型特征点检索的矢量字符识别方法，其特征在于：所述的步骤S500中，词袋树索引和视觉词典通过如下步骤创建：S510、挑选需要进行识别的常用字体，获取这些字体的.ttf或.ttc文件；S520、设定识别字符范围，对每个字体的每个字符进行数字顺序编号形成字符ID；S530、依次遍历每个字符执行步骤S540，得到所有字符的ORB特征矢量后执行步骤S550；S540、通过该字符的unicode码在.ttf或.ttc文件中查找指定字符得到该字符的轮廓信息，根据步骤S200
‑
S400得到该字符的ORB特征矢量；S550、将所有字符的ORB特征矢量集合，通过词袋模型算法进行词袋聚类，创建视觉词典和词袋树索引。3.如权利要求2所述的基于词袋模型特征点检索的矢量字符识别方法，其特征在于：所述的步骤S300中，包括如下步骤：S310、将控制点坐标规范化到一定大小的方形坐标区域；S320、将控制点绘制成白底黑点的控制点灰度图。4.如权利要求2所述的基于词袋模型特征点检索的矢量字符识别方法，其特征在于：所述的步骤S520中，包括如下步骤：S521、计算识别字符范围内包含的总字符数量N；S522、对第一字体的N个字符按顺序编号为1~N；S553、对第二字体的N个字符按顺序编号为(N+1)~2N；S554、以此类推，针对M个字体的N个字符按顺序编号为1~(M*N)，其中编号即为字符ID。5.如权利要求2所述的基于词袋模型特征点检索的矢量字符识别方法，其特征在于：所述的步骤S310中，方形区域大小为128*128px；步骤S550中，词袋模型算法为DBow2或DBow3或FBow。6.如权利要求2所述的基于词袋模型特...

【专利技术属性】
技术研发人员：田辉，张志翔，郭玉刚，
申请(专利权)人：合肥高维数据技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人