一种公式识别算法制造技术

技术编号：38030537 阅读：15 留言：0更新日期：2023-06-30 10:57

本发明专利技术提供的公式识别算法，包括特征提取模块、特征融合模块、特征编码模块、特征解码模块，以及动态软标签生成模块，算法包括以下步骤：步骤S1，特征提取模块从原始输入图片中提取数学表达式结构、全局上下文特征及局部上下文特征；步骤S2，特征融合模块对特征提取模块得到的全局上下文特征及局部上下文特征进行融合；步骤S3，特征编码模块在融合的特征内部进行全局交互，并根据输入的位置信息确定公式的结构；步骤S4，特征解码模块对特征编码模块压缩后的特征进行解码；步骤S5，动态软标签模块为模型训练提供合理的训练标签。块为模型训练提供合理的训练标签。块为模型训练提供合理的训练标签。

全部详细技术资料下载

【技术实现步骤摘要】
一种公式识别算法

[0001]本专利技术涉及计算机视觉
，尤其是涉及一种公式识别算法。

技术介绍

[0002]数学作为通用的自然科学语言，在教育、金融、培训等行业发展中有着重要的地位。数学计算表达式作为重要的数学载体，广泛出现在教育教学、科研活动等相关文档中。然而，数学表达式通常以图片的形式出现，不能被数字计算机进行分析处理。因此，需要开发识别技术将数学表达式由图片的形式转化为可编辑、可处理的文字表示，使其能够被数字计算机处理，从而易于输入、修改、传输、分析和搜索数学表达式。基于以上原因，数学表达式识别的研究成为当下热门的研究课题，快速并准确地识别数学表达式，具有现实和长远的意义。
[0003]最早的数学表达式识别算法由Anderson博士于1968年提出，并收到了持续的关注。传统的数学计算表达式识别算法可以归纳为以下三步：数学符号分割，符号识别，以及表达式结构的解析。字符分割是将数学表达式中的字符逐个进行提取和分割，字符识别是将分割出的字符进行理解、分类，表达式结构解析是以字符的空间位置、几何及视觉特征等信息为基础，得到字符间的关联，将识别后的字符按照其空间结构进行排列再现。
[0004]传统的数学表达式识别算法虽然具有较强的可解释性，但往往需要对特征提取进行手工设计，它的识别性能与表达式样本、算法结构紧密相关，推理时间过长。近年来，随着深度学习技术的发展，机器和算法处理复杂任务的能力日益增强。卷积神经网络(CNN)因其对图像的平移、旋转不变性，以及权重共享等优点，已被广泛用于模式识别，逐步渗...

【技术保护点】

【技术特征摘要】
1.一种公式识别算法，包括特征提取模块、特征融合模块、特征编码模块、特征解码模块，以及动态软标签生成模块，其特征在于，所述算法包括以下步骤：步骤S1，所述特征提取模块从原始输入图片中提取数学表达式结构、全局上下文特征及局部上下文特征；步骤S2，所述特征融合模块对所述特征提取模块得到的所述全局上下文特征及所述局部上下文特征进行融合；步骤S3，所述特征编码模块在所述融合的特征内部进行全局交互，并根据输入的位置信息确定公式的结构；步骤S4，所述特征解码模块对所述特征编码模块压缩后的特征进行解码；步骤S5，所述动态软标签模块为模型训练提供合理的训练标签。2.根据权利要求1所述的公式识别算法，其特征在于，所述特征提取模块采用双分支网络结构，分别提取数学表达式的所述全局上下文信息和所述局部上下文信息。3.根据权利要求2所述的公式识别算法，其特征在于，所述双分支网络结构由卷积神经网络及激活函数构成。4.根据权利要求1所述的公式识别算法，其特征在于，所述步骤S2包括以下步骤：步骤S21，将由所述特征提取模块提取的所述局部上下文特征记为L，所述全局上下文特征记为G；步骤S22，对所述局部上下文特...

【专利技术属性】
技术研发人员：朱跃生，王宇晴，翁振宇，
申请(专利权)人：北京大学深圳研究生院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人