【技术实现步骤摘要】
本专利技术涉及计算机图像处理
,尤其涉及ー种文档图像中复杂公式区域的检测方法及系统。
技术介绍
在文档图像数字化的过程中,需要对公式进行处理。现有的操作方式是由人工对公式区域进行标记,然后以图片的形式贴到对应的数字化版面中。由于科技文献和技术文档中往往存在着大量的数学公式,而数学公式又是ー种非常复杂的文档结构,在目前的数字化加工流程中主要采取手工方式对公式区域进行标记。这不仅带来人力成本的剧增,而且会导致整个加工流程受到公式的制约导致效率低下,会影响到整个数字化的加工流程。目前国内有部分专利涉及几种公式区域检测方法,具体如下(1)中国专利申请 《中文印刷体公式识别方法》(申请号200710144588. 8,公开日期2008年3月沈日)公开的方法是利用OCR对各个字符进行识别,将拒识区域标记为公式。该方法的缺点是检测的精度和效率主要依赖于汉字识别模块的识别率和识别速度。(2)中国专利申请《图像中数学公式的自动识别方法》(申请号200810053443. 1,公开日期2008年12月M日)公开的方法是将公式分为独立行公式和内嵌公式两种,并且利用不同的方法进行 ...
【技术保护点】
【技术特征摘要】
【专利技术属性】
技术研发人员:胡希驰,史培培,
申请(专利权)人:方正国际软件有限公司,方正国际软件北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。