当前位置: 首页 > 专利查询>佛山市南海区广工大数控装备协同创新研究院专利>正文

一种基于局部敏感哈希网络的汉明OCR识别方法技术

技术编号：28422041 阅读：28 留言：0更新日期：2021-05-11 18:29

本发明专利技术公开了一种基于局部敏感哈希网络的汉明OCR识别方法，包括以下步骤：S1、采集具有OCR的场景文本图像，用于制作训练集和测试集；S2、构建辅助模型，用训练集的文本图像优化辅助模型，对模型进行训练，生成所有字符的局部敏感哈希编码；S3、构建汉明OCR主模型，把局部敏感哈希编码作为汉明OCR主模型的嵌入层进行输出，得到初始化汉明OCR主模型；S4、用所述训练集的文本图像优化所述初始化汉明OCR主模型的参数，得到最优汉明OCR网络模型；S5、将待识别的的文本图像输入到所述最优汉明OCR网络模型，所述最优汉明OCR网络模型生成输出编码，由输出编码得到文本识别结果。本发明专利技术减少了模型存储占用容量，同时提高了模型稳定性和运行效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于局部敏感哈希网络的汉明OCR识别方法
本专利技术涉及文本识别领域，具体涉及一种基于局部敏感哈希网络的汉明OCR识别方法。
技术介绍
场景文本识别旨在图像中提取文本内容，在实际应用中具有巨大的商业价值。场景文本识别，通常包括对场景文字定位和文字识别。例如在中文文本识别，国内外已经存在了大量成熟的检测识别方法，并且应用到实际工作中。这些方法不仅检测快，而且识别率良好，具有一定的优越性。虽然，场景文本识别取得了一定的突破性成就，也产生了很多代表性的模型，但是这些模型大多数都很笨重。普遍的场景文本识别模型最后回归分类采用独热编码对每个字符进行编码，当词汇表的规模很大，那么模型的字符嵌入层和回归分类层产生的映射矩阵将会占用大量的存储容量，导致这些模型很难在移动端设备上部署，因为它消耗了大量存储资源和计算空间。因此，开发一种词汇列表大、占用空间小，识别精度高的轻量级别场景文本识模型是必要的。
技术实现思路
针对现有技术的不足，本专利技术的目的旨在提供一种种基于局部敏感哈希网络的汉明OCR识别方法。为实现上述目的，本专利技术采用如下技术方案：一种基于局部敏感哈希网络的汉明OCR识别方法，包括以下步骤：S1：采集具有OCR的场景文本图像，用于制作训练集和测试集；所述训练集中文本图像均包含文本标注；S2：构建辅助模型，用所述训练集的文本图像优化所述辅助模型，对所述模型进行训练，生成辅助编码，由所述辅助编码得到所有字符的局部敏感哈希编码；S3：构建汉明OCR主模型，把所...

【技术保护点】
1.一种基于局部敏感哈希网络的汉明OCR识别方法，其特征在于，包括以下步骤：/nS1：采集具有OCR的场景文本图像，用于制作训练集和测试集；所述训练集中文本图像均包含文本标注；/nS2：构建辅助模型，用所述训练集的文本图像优化所述辅助模型，对所述模型进行训练，生成辅助编码，由所述辅助编码得到所有字符的局部敏感哈希编码；/nS3：构建汉明OCR主模型，把所述局部敏感哈希编码作为所述汉明OCR主模型的嵌入层进行输出，得到初始化汉明OCR主模型；/nS4：用所述训练集的文本图像优化所述初始化汉明OCR主模型的参数，得到最优汉明OCR网络模型，将所述测试集中的文本图像输入到所述最优汉明OCR网络模型，检验所述最优汉明OCR网络模型的有效性；/nS5：将待识别的的文本图像输入到所述最优汉明OCR网络模型，所述最优汉明OCR网络模型生成输出编码，由所述输出编码得到文本识别结果。/n

【技术特征摘要】
1.一种基于局部敏感哈希网络的汉明OCR识别方法，其特征在于，包括以下步骤：
S1：采集具有OCR的场景文本图像，用于制作训练集和测试集；所述训练集中文本图像均包含文本标注；
S2：构建辅助模型，用所述训练集的文本图像优化所述辅助模型，对所述模型进行训练，生成辅助编码，由所述辅助编码得到所有字符的局部敏感哈希编码；
S3：构建汉明OCR主模型，把所述局部敏感哈希编码作为所述汉明OCR主模型的嵌入层进行输出，得到初始化汉明OCR主模型；
S4：用所述训练集的文本图像优化所述初始化汉明OCR主模型的参数，得到最优汉明OCR网络模型，将所述测试集中的文本图像输入到所述最优汉明OCR网络模型，检验所述最优汉明OCR网络模型的有效性；
S5：将待识别的的文本图像输入到所述最优汉明OCR网络模型，所述最优汉明OCR网络模型生成输出编码，由所述输出编码得到文本识别结果。

2.根据权利要求1所述的一种基于局部敏感哈希网络的汉明OCR识别方法，其特征在于，所述步骤S1还包括：
将采集到所述具有OCR的场景文本图像按4:1划分训练集和测试集。

3.根据权利要求1所述的一种基于局部敏感哈希网络的汉明OCR识别方法，其特征在于，所述步骤S1中用于文本标注的标签为包围文本实例的多边形坐标和文本序列。

4.根据权利要求1所述的一种基于局部敏感哈希网络的汉明OCR识别方法，其特征在于，所述辅助模型和所述汉明OCR主模型均包括特征编码器、位置编码器、嵌入层、解码网络和分类器；所述特征编码器的输入端输入的是文本图像，所述特征编码器的输出端和位置编码器的输出端共同连接至所述解码网络的其...

【专利技术属性】
技术研发人员：黄坤山，葛任贤，杨航，
申请(专利权)人：佛山市南海区广工大数控装备协同创新研究院，佛山市广工大数控装备技术发展有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人