【技术实现步骤摘要】
一种数学公式识别方法、装置、设备及可读存储介质
本申请涉及光学字符识别
,尤其涉及一种数学公式识别方法、装置、设备及可读存储介质。
技术介绍
随着互联网技术和电子科学技术的发展,手机、平板电脑等移动设备在人们生活占据着越来越重要的地位。移动设备根据其自身特点,主要依靠触摸屏来完成人机交互任务。对于移动设备而言,基于触摸屏的人机交互方式相比于电脑的键盘和鼠标交互方式,省去了外接设备的不便,同时也使得手写输入成为移动设备最为重要的输入方式。然而,目前缺乏对于数学公式输入的有效解决方案,对于数学公式的输入,最重要的就是识别出用户书写的数学公式,然而,目前尚不存在有效的识别方法。
技术实现思路
有鉴于此,本申请提供了一种数学公式识别方法、装置、设备及可读存储介质,用以对用户基于输入单元书写的数学公式进行有效识别,其技术方案如下:一种数学公式识别方法,包括:获取目标对象,所述目标对象包括多行文本,目标公式为所述多行文本中的一行;将所述目标对象基于输入轨迹进行分行处理,将所述目标公式所在行作为待识别对象;从所述待识别对象中识别出每个字符以及每个字符与上一字符的相对位置信息;基于识别出的每个字符和每个字符与上一字符的相对位置信息,确定所述待识别对象对应的识别结果。可选的,所述将所述目标对象基于输入轨迹进行分行处理,将所述目标公式所在行作为待识别对象,包括:基于所述输入轨迹将所述目标对象分割为笔画,并对分割的笔画进行分行,获得多个笔画行;将所述目标公式对应的笔画行合成为字符,合成后的该行字符作为所述待识别对象。可选的,所述对分割的笔画进行分行,包括:对于分割得到的每个笔 ...
【技术保护点】
1.一种数学公式识别方法,其特征在于,包括:获取目标对象,所述目标对象包括多行文本,目标公式为所述多行文本中的一行;将所述目标对象基于输入轨迹进行分行处理,将所述目标公式所在行作为待识别对象;从所述待识别对象中识别出每个字符以及每个字符与上一字符的相对位置信息;基于识别出的每个字符和每个字符与上一字符的相对位置信息,确定所述待识别对象对应的识别结果。
【技术特征摘要】
1.一种数学公式识别方法,其特征在于,包括:获取目标对象,所述目标对象包括多行文本,目标公式为所述多行文本中的一行;将所述目标对象基于输入轨迹进行分行处理,将所述目标公式所在行作为待识别对象;从所述待识别对象中识别出每个字符以及每个字符与上一字符的相对位置信息;基于识别出的每个字符和每个字符与上一字符的相对位置信息,确定所述待识别对象对应的识别结果。2.根据权利要求1所述的数学公式识别方法,其特征在于,所述将所述目标对象基于输入轨迹进行分行处理,将所述目标公式所在行作为待识别对象,包括:基于所述输入轨迹将所述目标对象分割为笔画,并对分割的笔画进行分行,获得多个笔画行;将所述目标公式对应的笔画行合成为字符,合成后的该行字符作为所述待识别对象。3.根据权利要求2所述的数学公式识别方法,其特征在于,所述对分割的笔画进行分行,包括:对于分割得到的每个笔画:若该笔画为新一行的笔画,则创建一行,并将该笔画加入该行,该行的当前外接矩形为该笔画的外接矩形,该行的当前中心线为该笔画的外接矩形的中心线;若该笔画不是新一行的笔画,则基于该笔画的外接矩形以及每行的外接矩形或中心线确定该笔画所属行,将该笔画加入其所属行,该笔画所属行的当前外接矩形为该笔画所属行当前所有笔画的外接矩形,该笔画所属的行的中心线为该笔画所属行当前所有笔画的外接矩形的中心线。4.根据权利要求3所述的数学公式识别方法,其特征在于,所述基于该笔画的外接矩形以及每行的外接矩形或中心线确定该笔画所属行,包括:对于每一行,若该笔画的外接矩形完全位于该行的外接矩形内,或者,该行的中心线穿过该笔画的外接矩形,则确定该行为该笔画所属行;若该笔画的外接矩形未完全位于该行的外接矩形内,并且,该行的中心线未穿过该笔画的外接矩形,则确定预设个目标笔画,基于各个所述目标笔画所属行确定该笔画所属行,其中,各个所述目标笔画与该笔画的距离均小于其它笔画与该笔画的距离。5.根据权利要求3所述的数学公式识别方法,其特征在于,确定该笔画是否为新一行的笔画,包括:当该笔画相对上一笔画未向预设方向偏移时,确定该笔画不是新一行的笔画;当该笔画相对上一笔画向所述预设方向偏移时,若该笔画为分式线,则确定该笔画不是新一行的笔画;若该笔画不为分式线,且该笔画的上一笔画为分式线,则确定该笔画不是新一行的笔画;若该笔画不为分式线,该笔画的上一笔画也不为分式线,且该笔画不在上一行的外接矩形内,且该笔画与上一行的各个字符和上一行的外接矩形的中心线均没有重叠,则确定该笔画为新一行的笔画。6.根据权利要求1~5中任意一项所述的数学公式识别方法,其特征在于,所述从所述待识别对象中识别出每个字符以及每个字符与上一字符的相对位置信息,包括:获取所述待识别对象中每个字符对应的相对位置信息,一个字符对应的相对位置信息为该字符与第一个字符的相对位置信息;通过预先建立的公式识别模型提取每个字符对应的字符特征;基于每个字符对应的字符特征和相对位置信息,通过所述公式识别模型确定所述每个字符的识别结果以及每个字符与上一字符的相对位置信息。7.根据权利要求6所述的数学公式识别方法,其特征在于,所述通过预先建立的公式识别模型提取每个字符对应的字符特征,包括:通过所述公式识别模型中的特征提取模块,提取所述每个字符对应的字符特征;所述基于每个字符对应的字符特征和相对位置信息,通过所述公式识别模型确定所述每个字符的识别结果以及每个字符与上一字符的相对位置信息,包括:通过所述公式识别模型中的编码模块,对所述每个字符对应的字符特征和相对位置信息进行编码,获得每个字符对...
【专利技术属性】
技术研发人员:李飞吾,胡金水,殷兵,刘聪,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。