公式录入方法及计算机存储介质技术

技术编号：24034750 阅读：20 留言：0更新日期：2020-05-07 01:35

本发明专利技术实施例提供一种公式录入方法及计算机存储介质。方法包括：对包含有待录入公式的图像进行字符识别，并获得与待录入公式对应的多个字符框及各个字符框对应的字符内容；根据各个字符框的相对位置关系，确定待录入公式中满足预设公式结构的至少一个字符框集合，其中，各字符框集合中包括至少两个字符框；针对各字符框集合，对字符框集合中的字符框进行至少一次合并处理，针对每次合并处理，将合并处理涉及的字符框对应的字符内容合并，以确定合并处理生成的字符框对应的字符内容，直至将各字符框集合中的字符框合并生成为一个新的字符框，并获得新的字符框对应的字符内容；根据各个新的字符框及对应的字符内容进行公式录入。

Formula input method and computer storage medium

全部详细技术资料下载

【技术实现步骤摘要】
公式录入方法及计算机存储介质
本专利技术实施例涉及计算机
，尤其涉及一种公式录入方法及计算机存储介质。
技术介绍
随着网络教学的日益普及，将教学过程中的题目录入系统成为网络教学中的一个重要环节。在将题目录入系统的过程中，存在着将公式录入系统的需求。例如，将以图片形式存储的题目录入到系统中。在这一过程中，如果题目中存在公式，则需要进行公式录入。因为公式本身结构复杂，而且存在许多含义不同的符号，使得机器无法自动化准确识别公式含义，造成无法自动录入准确的公式。因此，目前进行公式录入的主要方式为人工录入的方式。但是，采用人工录入公式的方式不仅效率低，而且劳动强度大。
技术实现思路
有鉴于此，本专利技术实施例所解决的技术问题之一在于提供一种公式录入方法及计算机存储介质，用以克服现有技术中的公式录入效率低的问题。本专利技术实施例的第一方面，提供一种公式录入方法，包括：对包含有待录入公式的图像进行字符识别，并获得与所述待录入公式对应的多个字符框及各个字符框对应的字符内容；根据各个所述字符框的相对位置关系，确定所述待录入公式中满足预设公式结构的至少一个字符框集合，其中，各个所述字符框集合中包括至少两个字符框；针对各个所述字符框集合，对字符框集合中的字符框进行至少一次合并处理，针对每次合并处理，将合并处理涉及的字符框对应的字符内容合并，以确定合并处理生成的字符框对应的字符内容，直至将各个所述字符框集合中的字符框合并生成为一个新的字符框，并获得所述新的字符框对应的字符内容；根据各个所述新的字符框...

【技术保护点】
1.一种公式录入方法，其特征在于，包括：/n对包含有待录入公式的图像进行字符识别，并获得与所述待录入公式对应的多个字符框及各个字符框对应的字符内容；/n根据各个所述字符框的相对位置关系，确定所述待录入公式中满足预设公式结构的至少一个字符框集合，其中，各个所述字符框集合中包括至少两个字符框；/n针对各个所述字符框集合，对字符框集合中的字符框进行至少一次合并处理，针对每次合并处理，将合并处理涉及的字符框对应的字符内容合并，以确定合并处理生成的字符框对应的字符内容，直至将各个所述字符框集合中的字符框合并生成为一个新的字符框，并获得所述新的字符框对应的字符内容；/n根据各个所述新的字符框及对应的字符内容进行公式录入。/n

【技术特征摘要】
1.一种公式录入方法，其特征在于，包括：
对包含有待录入公式的图像进行字符识别，并获得与所述待录入公式对应的多个字符框及各个字符框对应的字符内容；
根据各个所述字符框的相对位置关系，确定所述待录入公式中满足预设公式结构的至少一个字符框集合，其中，各个所述字符框集合中包括至少两个字符框；
针对各个所述字符框集合，对字符框集合中的字符框进行至少一次合并处理，针对每次合并处理，将合并处理涉及的字符框对应的字符内容合并，以确定合并处理生成的字符框对应的字符内容，直至将各个所述字符框集合中的字符框合并生成为一个新的字符框，并获得所述新的字符框对应的字符内容；
根据各个所述新的字符框及对应的字符内容进行公式录入。

2.根据权利要求1所述的方法，其特征在于，所述预设公式结构包括下列至少之一：横向域公式结构、根式域公式结构、上下域公式结构和角标域公式结构。

3.根据权利要求2所述的方法，其特征在于，当预设公式结构包括根式域公式结构时，所述根据各个所述字符框的相对位置关系，确定所述待录入公式中满足预设公式结构的至少一个字符框集合，包括：
根据各个所述字符框的相对位置关系，确定是否存在至少一个根式域公式结构；
若存在，则针对每个根式域公式结构，将对应的字符框生成一个字符框集合。

4.根据权利要求2所述的方法，其特征在于，当预设公式结构包括上下域公式结构时，所述根据各个所述字符框的相对位置关系，确定所述待录入公式中满足预设公式结构的至少一个字符框集合，包括：
根据各个所述字符框的宽度和高度，确定宽度阈值和/或高度阈值；
根据所述宽度阈值、高度阈值和各个所述字符框的相对位置关系，确定是否存在至少一个上下域公式结构；
若存在，则针对每个上下域公式结构，将对应的字符框生成一个字符框集合。

5.根据权利要求2所述的方法，其特征在于，针对各个所述字符框集合，对字符框集合中的字符框进行至少一次合并处理，包括：
从所有字符框集合中确定当前待处理的字符框集合；
确定所述当前待处理的字符框集合是否为多级字符框集合，其中，所述多级字符框集合为字符框集合中嵌套有至少一级下级字符框集合的集合；
若为多级字符框集合，则将所述多级字符框集合中最下级的字符框集合确定为新的当前待处理字符框集合；
若不为多级字符框集合，则对所述当前待处理的字符框集合中的字符框依次进行合并生成一个新的字符框。

6.根据权利要求5所述的方法，其特征在于，对所述当前待处理的字符框集合中的字符框依次进行合并生成一个新的字符框，包括：
针对与根式域公式结构对应的字符框集合，若属于根式内容的字符框的数量为1，则将根式符号对应的字符框和根式内容对应的字符框合并，生成与所述根式域公式结构对应的新的字符框；
若属于根式内容的字...

【专利技术属性】
技术研发人员：兴百桥，
申请(专利权)人：北京新唐思创教育科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人