一种文档图像中复杂公式区域的检测方法及系统技术方案

技术编号:7543375 阅读:290 留言:0更新日期:2012-07-13 06:54
本发明专利技术公开了一种文档图像中复杂公式区域的检测方法及系统,涉及计算机图像处理技术领域。本发明专利技术解决上述技术问题的关键在于:1、连通域邻域信息编码计算方法;2、利用连通域邻域信息编码检测图像中复杂公式区域的方法。利用本发明专利技术提出的公式区域检测方法及系统可以较为准确地检测文档图像中复杂的公式区域,速度快效率高。将其应用于数字化加工流程中,可以提高数字化加工流程的效率,大大减少人力成本。

【技术实现步骤摘要】

本专利技术涉及计算机图像处理
,尤其涉及ー种文档图像中复杂公式区域的检测方法及系统
技术介绍
在文档图像数字化的过程中,需要对公式进行处理。现有的操作方式是由人工对公式区域进行标记,然后以图片的形式贴到对应的数字化版面中。由于科技文献和技术文档中往往存在着大量的数学公式,而数学公式又是ー种非常复杂的文档结构,在目前的数字化加工流程中主要采取手工方式对公式区域进行标记。这不仅带来人力成本的剧增,而且会导致整个加工流程受到公式的制约导致效率低下,会影响到整个数字化的加工流程。目前国内有部分专利涉及几种公式区域检测方法,具体如下(1)中国专利申请 《中文印刷体公式识别方法》(申请号200710144588. 8,公开日期2008年3月沈日)公开的方法是利用OCR对各个字符进行识别,将拒识区域标记为公式。该方法的缺点是检测的精度和效率主要依赖于汉字识别模块的识别率和识别速度。(2)中国专利申请《图像中数学公式的自动识别方法》(申请号200810053443. 1,公开日期2008年12月M日)公开的方法是将公式分为独立行公式和内嵌公式两种,并且利用不同的方法进行分别提取。其中独立公本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:胡希驰史培培
申请(专利权)人:方正国际软件有限公司方正国际软件北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术