【技术实现步骤摘要】
一种文档图像匹配方法及设备
[0001]本专利技术涉及一种文档图像匹配方法及设备,属于图像处理领域。
技术介绍
[0002]纸质文档可由拍照、扫描或者其他途径转化为电子图像。在实际应用中,由于图像获取途径不同,常常会得到大量重复的电子图像(尤其是由同一份文档经不同转化方法得到的多个电子图像,识别难度大、数量多),占用大量的存储空间,增加后续图像处理的工作量。故需要自动匹配属于同一份文档的不同电子图像。比如,在财税报账系统中,扫描纸质发票得到的图像与发票拍照电子件之间的匹配。
[0003]常规的图像匹配方案如下:通过SURF(Speeded Up Robust Features,快速特征点检测)等特征点检测算法提取并描述特征点(即特征描述算子),并根据特征描述算子对两张图像的特征点进行两两匹配,其中具有映射关系的两个特征点即为匹配特征对;根据匹配特征对数量来衡量两张图像之间的匹配程度(数量超过数量阈值则匹配)。然而相较于自然场景下的特征点之间存在强差异性,文档场景的特征点差异性较弱,仅根据单维度信息(即特征描述算子)进 ...
【技术保护点】
【技术特征摘要】
1.一种文档图像匹配方法,其特征在于,包括如下步骤:S1、获取待匹配的第一图像与第二图像;S2、分别获取第一图像的第一特征点集和第二图像的第二特征点集;并根据所述第一特征点集和第二特征点集,获取第一图像与第二图像的匹配特征对集;S3、根据匹配特征对的匹配度,剔除匹配特征对集中的误匹配特征对;S4、建立透视变换矩阵;根据匹配特征对集,求解透视变换矩阵;验证透视变换矩阵,若透视变换矩阵通过验证,则认定第一图像与第二图像相似;否则认定第一图像与第二图像不相似。2.根据权利要求1所述的一种文档图像匹配方法,其特征在于,还包括:若认定第一图像与第二图像相似,则将匹配特征对划分为完美匹配特征对和较好匹配特征对;根据完美匹配特征对的数量和较好匹配特征对的数量,计算第一图像与第二图像的相似度;其中,完美匹配特征对为特征点之间坐标误差低于第一阈值的匹配特征对;较好匹配特征对为特征点之间坐标误差超过第一阈值的匹配特征对。3.根据权利要求2所述的一种文档图像匹配方法,其特征在于,还包括:将所述相似度映射至0到100的区间,以公式表达为:式中:s表示相似分数;N表示匹配特征对的总数量;M表示相似度。4.根据权利要求1所述的一种文档图像匹配方法,其特征在于,所述第一特征点集和第二特征点集的获取步骤具体为:分别在第一图像与第二图像上截取感兴趣区域,得到第一区域和第二区域;分别检测第一区域与第二区域内的特征点,得到所述第一特征点集和所述第二特征点集。5.根据权利要求1所述的一种文档图像匹配方法,其特征在于,所述匹配特征对集的获取步骤具体为:前向匹配:根据所述第二特征点集建立第二KD树;通过最邻近算法在第二KD树中查找与第一特征点集中各特征点相匹配的特征点,将匹...
【专利技术属性】
技术研发人员:林机鹏,陈昊,吴胜杰,陈昕昊,
申请(专利权)人:厦门商集网络科技有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。