公式录入方法及计算机存储介质技术

技术编号:24034750 阅读:20 留言:0更新日期:2020-05-07 01:35
本发明专利技术实施例提供一种公式录入方法及计算机存储介质。方法包括:对包含有待录入公式的图像进行字符识别,并获得与待录入公式对应的多个字符框及各个字符框对应的字符内容;根据各个字符框的相对位置关系,确定待录入公式中满足预设公式结构的至少一个字符框集合,其中,各字符框集合中包括至少两个字符框;针对各字符框集合,对字符框集合中的字符框进行至少一次合并处理,针对每次合并处理,将合并处理涉及的字符框对应的字符内容合并,以确定合并处理生成的字符框对应的字符内容,直至将各字符框集合中的字符框合并生成为一个新的字符框,并获得新的字符框对应的字符内容;根据各个新的字符框及对应的字符内容进行公式录入。

Formula input method and computer storage medium

【技术实现步骤摘要】
公式录入方法及计算机存储介质
本专利技术实施例涉及计算机
,尤其涉及一种公式录入方法及计算机存储介质。
技术介绍
随着网络教学的日益普及,将教学过程中的题目录入系统成为网络教学中的一个重要环节。在将题目录入系统的过程中,存在着将公式录入系统的需求。例如,将以图片形式存储的题目录入到系统中。在这一过程中,如果题目中存在公式,则需要进行公式录入。因为公式本身结构复杂,而且存在许多含义不同的符号,使得机器无法自动化准确识别公式含义,造成无法自动录入准确的公式。因此,目前进行公式录入的主要方式为人工录入的方式。但是,采用人工录入公式的方式不仅效率低,而且劳动强度大。
技术实现思路
有鉴于此,本专利技术实施例所解决的技术问题之一在于提供一种公式录入方法及计算机存储介质,用以克服现有技术中的公式录入效率低的问题。本专利技术实施例的第一方面,提供一种公式录入方法,包括:对包含有待录入公式的图像进行字符识别,并获得与所述待录入公式对应的多个字符框及各个字符框对应的字符内容;根据各个所述字符框的相对位置关系,确定所述待录入公式中满足预设公式结构的至少一个字符框集合,其中,各个所述字符框集合中包括至少两个字符框;针对各个所述字符框集合,对字符框集合中的字符框进行至少一次合并处理,针对每次合并处理,将合并处理涉及的字符框对应的字符内容合并,以确定合并处理生成的字符框对应的字符内容,直至将各个所述字符框集合中的字符框合并生成为一个新的字符框,并获得所述新的字符框对应的字符内容;根据各个所述新的字符框及对应的字符内容进行公式录入。本专利技术实施例的第二方面,提供一种计算机存储介质,所述计算机介质存储有:用于对包含有待录入公式的图像进行字符识别,并获得与所述待录入公式对应的多个字符框及各个字符框对应的字符内容的指令;用于根据各个所述字符框的相对位置关系,确定所述待录入公式中满足预设公式结构的至少一个字符框集合的指令,其中,各个所述字符框集合中包括至少两个字符框;用于针对各个所述字符框集合,对字符框集合中的字符框进行至少一次合并处理的指令,用于针对每次合并处理,将合并处理涉及的字符框对应的字符内容合并,以确定合并处理生成的字符框对应的字符内容的指令,用于直至将各个所述字符框集合中的字符框合并生成为一个新的字符框,并获得所述新的字符框对应的字符内容的指令;用于根据各个所述新的字符框及对应的字符内容进行公式录入的指令。由以上技术方案可见,本专利技术实施例的公式识别录入方案,对含有待录入公式的图像进行字符识别,之后根据各个字符框的相对位置关系,可以确定待录入公式中的各个预设的公式结构对应的字符框集合,之后分别针对各个字符框集合进行合并处理,且每次合并处理过程中均将涉及的字符框对应的字符内容进行合并,从而确定合并处理后的字符框对应的字符内容,由此避免公式录入过程中通过字符框间的位置关系指示的运算关系遗失,在保证公式录入准确性的情况下实现自动化公式录入,节省了人工成本,提高了公式录入效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1示出了本专利技术的实施例一的公式录入方法的流程图;图2示出了2本专利技术的实施例一的包含有待录入公式的图像的示意图;图3示出了本专利技术的实施例一的横向域公式结构的示意图;图4示出了本专利技术的实施例一的根式域公式结构的示意图;图5示出了本专利技术的实施例一的上下域公式结构的示意图;图6示出了本专利技术的实施例一的角标域公式结构的示意图;图7示出了本专利技术的实施例一的确定公式中根式域公式结构的示意图;图8示出了本专利技术的实施例二的公式录入方法的流程图;图9示出了本专利技术的实施例二中对公式进行字符检测和识别后的示意图;图10示出了本专利技术的实施例二的确定公式中根式域公式结构对应的字符框的示意图;图11示出了本专利技术的实施例二的合并2处所指示的根式域公式结构中的属于根式内容的字符框后的示意图;图12示出了本专利技术的实施例二的合并2处所指示的根式域公式结构后的示意图;图13示出了本专利技术的实施例二的合并1处所指示的根式域公式结构中的分式结构后的示意图;图14示出了本专利技术的实施例二的合并1处所指示的根式域公式结构中的角标结构后的示意图;图15示出了本专利技术的实施例二的合并1处所指示的根式域公式结构后的示意图;图16示出了本专利技术的实施例二的合并分式结构后的结构示意图;图17示出了本专利技术的实施例二的所有字符框的结构示意图。具体实施方式当然,实施本专利技术实施例的任一技术方案必不一定需要同时达到以上的所有优点。为了使本领域的人员更好地理解本专利技术实施例中的技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术实施例一部分实施例,而不是全部的实施例。基于本专利技术实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本专利技术实施例保护的范围。下面结合本专利技术实施例附图进一步说明本专利技术实施例具体实现。实施例一图1示出了本专利技术的实施例一的公式录入方法的流程图。如图1所示,本实施例的公式录入方法包括以下步骤:步骤S102:对包含有待录入公式的图像进行字符识别,并获得与所述待录入公式对应的多个字符框及各个字符框对应的字符内容。在进行公式录入的过程中,存在着几个影响公式录入效率的问题,例如,公式并未存储在电子设备上,如打印在纸上的公式、写在黑板上、墙上的公式;公式虽然存储在电子设备上,但由于存储的文件类型不能直接进行识别和处理等。为了解决这些问题中的部分或全部,可以将待录入的公式转换为包含该待录入公式的图像,后续通过对包含有待录入公式的图像进行处理实现利用电子设备进行公式录入,以提升公式录入效率的目的。例如,针对并未存储在电子设备上的公式,可以通过拍照的方式将其转化为包含有待录入公式的图像。针对存储在电子设备上但不能进行识别和处理的公式,可以确定文件类型是否为图像,若不为图像在可以通过打印的方式转换为图像;若为图像则可以直接对该图像进行后续处理。当然,前述的将待录入公式转换为图像的过程为可选过程,并非必须包含在本实施例的公式录入方法中。针对包含有待录入公式的图像,可以通过字符识别的方式获得与所述待录入公式对应的多个字符框及各个字符框对应的字符内容。字符识别的方式可以由本领域技术人员根据实际需要采用任意适当的方式,本实施例对此不作限定。例如,通过OCR(OpticalCharacterRecognition,光学字符识别)方式识别图像中的待录入公式的各个字符的位置以及字符内容。或者,利用公式字符检测及识别模型(如,SingleShotMulti本文档来自技高网...

【技术保护点】
1.一种公式录入方法,其特征在于,包括:/n对包含有待录入公式的图像进行字符识别,并获得与所述待录入公式对应的多个字符框及各个字符框对应的字符内容;/n根据各个所述字符框的相对位置关系,确定所述待录入公式中满足预设公式结构的至少一个字符框集合,其中,各个所述字符框集合中包括至少两个字符框;/n针对各个所述字符框集合,对字符框集合中的字符框进行至少一次合并处理,针对每次合并处理,将合并处理涉及的字符框对应的字符内容合并,以确定合并处理生成的字符框对应的字符内容,直至将各个所述字符框集合中的字符框合并生成为一个新的字符框,并获得所述新的字符框对应的字符内容;/n根据各个所述新的字符框及对应的字符内容进行公式录入。/n

【技术特征摘要】
1.一种公式录入方法,其特征在于,包括:
对包含有待录入公式的图像进行字符识别,并获得与所述待录入公式对应的多个字符框及各个字符框对应的字符内容;
根据各个所述字符框的相对位置关系,确定所述待录入公式中满足预设公式结构的至少一个字符框集合,其中,各个所述字符框集合中包括至少两个字符框;
针对各个所述字符框集合,对字符框集合中的字符框进行至少一次合并处理,针对每次合并处理,将合并处理涉及的字符框对应的字符内容合并,以确定合并处理生成的字符框对应的字符内容,直至将各个所述字符框集合中的字符框合并生成为一个新的字符框,并获得所述新的字符框对应的字符内容;
根据各个所述新的字符框及对应的字符内容进行公式录入。


2.根据权利要求1所述的方法,其特征在于,所述预设公式结构包括下列至少之一:横向域公式结构、根式域公式结构、上下域公式结构和角标域公式结构。


3.根据权利要求2所述的方法,其特征在于,当预设公式结构包括根式域公式结构时,所述根据各个所述字符框的相对位置关系,确定所述待录入公式中满足预设公式结构的至少一个字符框集合,包括:
根据各个所述字符框的相对位置关系,确定是否存在至少一个根式域公式结构;
若存在,则针对每个根式域公式结构,将对应的字符框生成一个字符框集合。


4.根据权利要求2所述的方法,其特征在于,当预设公式结构包括上下域公式结构时,所述根据各个所述字符框的相对位置关系,确定所述待录入公式中满足预设公式结构的至少一个字符框集合,包括:
根据各个所述字符框的宽度和高度,确定宽度阈值和/或高度阈值;
根据所述宽度阈值、高度阈值和各个所述字符框的相对位置关系,确定是否存在至少一个上下域公式结构;
若存在,则针对每个上下域公式结构,将对应的字符框生成一个字符框集合。


5.根据权利要求2所述的方法,其特征在于,针对各个所述字符框集合,对字符框集合中的字符框进行至少一次合并处理,包括:
从所有字符框集合中确定当前待处理的字符框集合;
确定所述当前待处理的字符框集合是否为多级字符框集合,其中,所述多级字符框集合为字符框集合中嵌套有至少一级下级字符框集合的集合;
若为多级字符框集合,则将所述多级字符框集合中最下级的字符框集合确定为新的当前待处理字符框集合;
若不为多级字符框集合,则对所述当前待处理的字符框集合中的字符框依次进行合并生成一个新的字符框。


6.根据权利要求5所述的方法,其特征在于,对所述当前待处理的字符框集合中的字符框依次进行合并生成一个新的字符框,包括:
针对与根式域公式结构对应的字符框集合,若属于根式内容的字符框的数量为1,则将根式符号对应的字符框和根式内容对应的字符框合并,生成与所述根式域公式结构对应的新的字符框;
若属于根式内容的字...

【专利技术属性】
技术研发人员:兴百桥
申请(专利权)人:北京新唐思创教育科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1