文档图像的方向检测装置及方法制造方法及图纸

技术编号:14780646 阅读:40 留言:0更新日期:2017-03-09 21:45
本发明专利技术实施例提供一种文档图像的方向检测装置及方法,其中,当文本行与选择的两个候选方向上的参考样本的相似度的差值比大于或等于第一阈值时,将所述两个候选方向中与最大相似度对应的候选方向的投票值加1,当该差值比小于第一阈值时,将两个候选方向中与最大相似度对应的候选方向的投票值加上所述差值比和与第一阈值相关的参数的乘积。这样,根据文本行与各个候选方向上参考样本的相似度的差值比,设定对候选方向进行投票的投票值,能够有效降低噪声文本行、低质量文本行以及不支持的文本行等对方向检测的影响,实现文档图像方向的精确检测。

【技术实现步骤摘要】

本专利技术涉及图像处理领域,尤其涉及一种文档图像的方向检测装置及方法
技术介绍
随着信息技术的不断发展,对于文档图像的归档与识别的应用日益普遍。而对于文档图像的方向检测是实现文档图像归档与识别的前提之一。目前,有很多方法被用于文档图像的方向检测。例如,现有的第一种检测方法基于特征的连通域的形状和位置的分布来进行方向检测,现有的第二种检测方法通过仅关注拉丁字符并检测特殊的如“i”或“T”的特征来决定方向;现有的第三种检测方法通过使用光学字符识别(OCR,OpticalCharacterRecognition)的识别结果进行投票来检测方向。应该注意,上面对技术背景的介绍只是为了方便对本专利技术的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本专利技术的
技术介绍
部分进行了阐述而认为上述技术方案为本领域技术人员所公知。
技术实现思路
本专利技术的专利技术人发现,当使用现有的第一种检测方法时,由于亚洲语言的手稿包括很多不同形状的特征集,该方法的鲁棒性较差,并且,当例如纸张或分辨率等因素导致噪声水平较高时,基于特征的连通域变得不可靠,从而影响了检测精度;现有的第二种检测方法存在类似的问题;而当使用现有的第三种检测方法时,如果噪声文本行的去除功能强大,很多候选的正确文本行被去除,导致可用于投票的文本行很少,检测结果不可靠,另外,由于投票值为整数,因此即使某个方向的置信度不高,但仍然将值为1的投票投给具有最高置信度的该方向,因此图像噪声以及OCR识别错误对检测结果的影响很大。本专利技术实施例提供一种文档图像的方向检测装置及方法,根据文本行与各个候选方向上参考样本的相似度的差值比,设定对候选方向进行投票的投票值,能够有效降低噪声文本行、低质量文本行以及不支持的文本行等对方向检测的影响,实现文档图像方向的精确检测。根据本专利技术实施例的第一方面,提供一种文档图像的方向检测装置,包括:投票单元,所述投票单元用于对文档图像中的文本行逐行进行投票,所述投票单元包括:第一计算单元,所述第一计算单元用于计算当前文本行与多个候选方向上的参考样本的相似度;选择单元,所述选择单元用于在多个候选方向中选择两个候选方向,其中,当前文本行与选择的所述两个候选方向上的参考样本具有最大相似度以及第二大相似度;第二计算单元,所述第二计算单元用于计算当前文本行与选择的所述两个候选方向上的参考样本的相似度的差值比;加法单元,所述加法单元用于当所述差值比大于或等于第一阈值时,将所述两个候选方向中与所述最大相似度对应的候选方向的投票值加1,当所述差值比小于第一阈值时,将所述两个候选方向中与所述最大相似度对应的候选方向的投票值加上所述差值比和与第一阈值相关的参数的乘积;所述装置还包括:确定单元,所述确定单元用于当多个候选方向的投票累计值中最大投票累计值与第二大投票累计值之差大于或等于第二阈值时,将所述文档图像的方向确定为多个候选方向中具有最大投票累计值的候选方向。根据本专利技术实施例的第二方面,提供一种文档图像的方向检测方法,包括:对文档图像中的文本行逐行进行投票,其中,对于每一个文本行的投票包括:计算当前文本行与多个候选方向上的参考样本的相似度;在多个候选方向中选择两个候选方向,其中,当前文本行与选择的所述两个候选方向上的参考样本具有最大相似度以及第二大相似度;计算当前文本行与选择的所述两个候选方向上的参考样本的相似度的差值比;当所述差值比大于或等于第一阈值时,将所述两个候选方向中与所述最大相似度对应的候选方向的投票值加1,当所述差值比小于第一阈值时,将所述两个候选方向中与所述最大相似度对应的候选方向的投票值加上所述差值比和与第一阈值相关的参数的乘积;所述方法还包括:当多个候选方向的投票累计值中最大投票累计值与第二大投票累计值之差大于或等于第二阈值时,将所述文档图像的方向确定为多个候选方向中具有最大投票累计值的候选方向。本专利技术的有益效果在于:根据文本行与各个候选方向上参考样本的相似度的差值比,设定对候选方向进行投票的投票值,能够有效降低噪声文本行、低质量文本行以及不支持的文本行等对方向检测的影响,实现文档图像方向的精确检测。参照后文的说明和附图,详细公开了本专利技术的特定实施方式,指明了本专利技术的原理可以被采用的方式。应该理解,本专利技术的实施方式在范围上并不因而受到限制。在所附权利要求的精神和条款的范围内,本专利技术的实施方式包括许多改变、修改和等同。针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用,与其它实施方式中的特征相组合,或替代其它实施方式中的特征。应该强调,术语“包括/包含”在本文使用时指特征、整件、步骤或组件的存在,但并不排除一个或更多个其它特征、整件、步骤或组件的存在或附加。附图说明所包括的附图用来提供对本专利技术实施例的进一步的理解,其构成了说明书的一部分,用于例示本专利技术的实施方式,并与文字描述一起来阐释本专利技术的原理。显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。在附图中:图1是本专利技术实施例1的文档图像的方向检测装置的结构示意图;图2是本专利技术实施例1的印刷文本行的示意图;图3是本专利技术实施例1的噪声文本行的示意图;图4是本专利技术实施例1的手写文本行的示意图;图5是本专利技术实施例2的电子设备的结构示意图;图6是本专利技术实施例2的电子设备的系统构成的一示意框图;图7是本专利技术实施例3的文档图像的方向检测方法流程图;图8是图7的步骤701中对于每一个文本行的投票方法流程图;图9是本专利技术实施例4的文档图像的方向检测方法流程图。具体实施方式参照附图,通过下面的说明书,本专利技术的前述以及其它特征将变得明显。在说明书和附图中,具体公开了本专利技术的特定实施方式,其表明了其中可以采用本专利技术的原则的部分实施方式,应了解的是,本专利技术不限于所描述的实施方式,相反,本专利技术包括落入所附权利要求的范围内的全部修改、变型以及等同物。实施例1图1是本专利技术实施例1的文档图像的方向检测装置的结构示意图。图1所示,该装置100包括:投票单元101,用于对文档图像中的文本行逐行进行投票,投票单元101包括:第一计算单元102,用于计算当前文本行与多个候选方向上的参考样本的相似度;选择单元103,用于在多个候选方向中选择两个候选方向,其中,当前文本行与选择的两个候选方向上的参考样本具有最大相似度以及第二大相似度;第二计算单元104,用于计算当前文本行与选择的两个候选方向上的参考样本的相似度的差值比;加法单元105,用于当该差值比大于或等于第一阈值时,将该两个候选方向中与最大相似度对应的候选方向的投票值加1,当该差值比小于第一阈值时,将该两个候选方向中与最大相似度对应的候选方向的投票值加上该差值比和与第一阈值相关的参数的乘积;该装置100还包括:确定单元106,用于当多个候选方向的投票累计值中最大投票累计值与第二大投票累计值之差大于或等于第二阈值时,将该文档图像的方向确定为多个候选方向中具有最大投票累计值的候选方向。由上述实施例可知,根据文本行与各个候选方向上参考样本的相似度的差值比,设定对候选方向进本文档来自技高网...
文档图像的方向检测装置及方法

【技术保护点】
一种文档图像的方向检测装置,包括:投票单元,所述投票单元用于对文档图像中的文本行逐行进行投票,所述投票单元包括:第一计算单元,所述第一计算单元用于计算当前文本行与多个候选方向上的参考样本的相似度;选择单元,所述选择单元用于在多个候选方向中选择两个候选方向,其中,当前文本行与选择的所述两个候选方向上的参考样本具有最大相似度以及第二大相似度;第二计算单元,所述第二计算单元用于计算当前文本行与选择的所述两个候选方向上的参考样本的相似度的差值比;加法单元,所述加法单元用于当所述差值比大于或等于第一阈值时,将所述两个候选方向中与所述最大相似度对应的候选方向的投票值加1,当所述差值比小于第一阈值时,将所述两个候选方向中与所述最大相似度对应的候选方向的投票值加上所述差值比和与第一阈值相关的参数的乘积;所述装置还包括:确定单元,所述确定单元用于当多个候选方向的投票累计值中最大投票累计值与第二大投票累计值之差大于或等于第二阈值时,将所述文档图像的方向确定为多个候选方向中具有最大投票累计值的候选方向。

【技术特征摘要】
1.一种文档图像的方向检测装置,包括:投票单元,所述投票单元用于对文档图像中的文本行逐行进行投票,所述投票单元包括:第一计算单元,所述第一计算单元用于计算当前文本行与多个候选方向上的参考样本的相似度;选择单元,所述选择单元用于在多个候选方向中选择两个候选方向,其中,当前文本行与选择的所述两个候选方向上的参考样本具有最大相似度以及第二大相似度;第二计算单元,所述第二计算单元用于计算当前文本行与选择的所述两个候选方向上的参考样本的相似度的差值比;加法单元,所述加法单元用于当所述差值比大于或等于第一阈值时,将所述两个候选方向中与所述最大相似度对应的候选方向的投票值加1,当所述差值比小于第一阈值时,将所述两个候选方向中与所述最大相似度对应的候选方向的投票值加上所述差值比和与第一阈值相关的参数的乘积;所述装置还包括:确定单元,所述确定单元用于当多个候选方向的投票累计值中最大投票累计值与第二大投票累计值之差大于或等于第二阈值时,将所述文档图像的方向确定为多个候选方向中具有最大投票累计值的候选方向。2.根据权利要求1所述的装置,其中,所述当前文本行与选择的所述两个候选方向上的参考样本的相似度的差值比是当前文本行与选择的所述两个候选方向上的参考样本的相似度之差和所述最大相似度的比值。3.根据权利要求1所述的装置,其中,所述与第一阈值相关的参数C满足:0<C<1/T,T为所述第一阈值。4.根据权利要求4所述的装置,其中,C=1/(2T),T为所述第一阈值。5.根据权利要求1所述的装置,其中,所述计算单元根据以下的任一种方法计算当前文本行与多个候选方向上的参考样本的相似度:基于光学字符识别;...

【专利技术属性】
技术研发人员:孙俊
申请(专利权)人:富士通株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1