基于模糊C均值聚类的碎纸片拼接复原方法技术

技术编号:19636219 阅读:126 留言:0更新日期:2018-12-01 16:47
本发明专利技术涉及图像拼接领域,尤其是一种基于模糊C均值聚类的图像(碎纸片)拼接复原方法。本发明专利技术根据文字特征对碎纸片做了二值化、水平投影、字符字块填补等预处理。然后,采用模糊C均值聚类算法,对预处理好的碎纸片进行分类处理。再根据横向拼接模型进行碎纸片横向拼接,最后根据纵向拼接模型进行纵向拼接,获得拼接原图。本发明专利技术提高了碎纸片分类的准确率,也有利于提高拼接的成功率和效率。

Recovery method of fragments splicing based on fuzzy C-means clustering

The invention relates to the field of image mosaic, in particular to an image mosaic restoration method based on fuzzy C-means clustering. According to the character characteristics, the invention preprocesses the fragments such as binarization, horizontal projection, character block filling, etc. Then, the pre-processed fragments are classified by using the fuzzy C-means clustering algorithm. Then, the fragments are spliced horizontally according to the horizontal splicing model. Finally, the original splicing map is obtained by the longitudinal splicing model. The invention improves the accuracy of classification of fragments, and is also beneficial to improving the success rate and efficiency of splicing.

【技术实现步骤摘要】
基于模糊C均值聚类的碎纸片拼接复原方法
本专利技术涉及图像拼接领域,尤其是一种基于模糊C均值聚类的图像(碎纸片)拼接复原方法。
技术介绍
数字图像拼接是属于图像处理的一个重要研究内容,是上世纪以来发展起来的图像处理技术之一,它是通过将分割开来的图像分块拼接成一幅完整的图像。图像碎片的拼接就属于数字图像拼接的一种,在原图被撕裂成各个碎片后,再通过这些碎片组合起来,得出原来的图像。碎片文件的拼接在司法物件复原、历史文献修复、计算机视觉、计算机图形学、诉讼领域、档案研究以及军事情报获取等领域都有着重要的作用。模糊C均值聚类算法通过优化目标函数,得到每个样本点对所有类中心的隶属度,从而决定样本点的类属以达到自动对样本数据进行分类的目的,主要用于数据的聚类分析。FCM算法是一种无监督的模糊聚类方法,理论成熟,应用广泛。大部分对碎片拼接复原方法的研究主要集中在碎片轮廓的匹配上,即基于轮廓的碎片拼接技术研究。许多学者提出了大量的算法,如,Helena在二维碎片拼合方面做了很多工作,他提出了把多尺度技术应用在曲面匹配过程中(HelenaCristinadaGamaLeitao.AMulti-ScaleMethodfortheRe-AssemblyofFragmentedObjects[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,2002,24(9):1239-1251),该方法有一定的稳定性,但其计算量偏大。Wolfson运用串匹配的技术查询最大匹配子串,解决了平面曲线匹配的问题(H.J.Wolfson.OnCurveMatching[J].IEEE.TransactionsonPatternAnalysisandMachineIntelligence.1990,12(5):483-489.)。该方法用于解决复杂场景中重叠物体的识别和定位,但对于简洁物体而言,同样会产生计算量大的问题。CarlosSolana等提出了基于特征匹配的手撕文档重构的方法(CarlosSolana,EdsonJustino.DocumentReconstructionBasedonFeatureMatching[J].IEEE.XVIIIBrazilianSymposiumonComputerGraphicsandImageProcessing,2005,12(5):586-593.)。该方法用多边形逼近来减少边界的复杂性,采用提取多边形的特点进行局部重建,可以减少计算的复杂性,但多边形的特征点较难确定。朱延娟等提出基于Hausdorffig距离的多尺度轮廓匹配算法(朱延娟,周来水,张丽艳等.基于Hausdorff距离的多尺度轮廓匹配算法[J].中国机械工程,2004,15(17):1553-1556)。该方法容易出现碎纸片拼合过程中的重叠现象。
技术实现思路
本专利技术的目的是提供一种基于模糊C均值聚类的碎纸片拼接复原方法,针对碎纸片进行预处理,提高了碎纸片分类的准确率,也有利于提高拼接的成功率和效率。本专利技术的技术方案:一种基于模糊C均值聚类的碎纸片拼接复原方法,包括以下步骤:步骤1:通过图片读取函数imread()读取n张碎纸片灰度值,每张碎纸片的灰度矩阵记为Pi,(i=1,...,n);步骤2:二值化处理灰度矩阵Pi,二值化处理后矩阵BPi=Pi./S,S为阈值;步骤3:每个灰度矩阵BPi的第一列和最后一列分别记为headi和reari,headi=BPi(:,1),reari=BP(:,end);步骤4:首先对灰度矩阵BPi进行水平投影处理,结果记为shadow(i,:),shadow矩阵每一行表示一个灰度矩阵的投影向量,再对每个投影向量进行字符、字块的填补处理;步骤5:采用模糊C均值聚类函数fcm()对投影向量shadow进行聚类,聚类结果记为index,index(k)记录着第k类的碎纸片编号;步骤6:求得每一类中的最左边碎纸片,计算每个灰度矩阵BPi前m列的灰度值之和grayi,最左边碎纸片的编号为flag为已拼接碎纸片最右边的碎纸片编号,flag=i*;步骤7:初始化i=1,ifi≤length(index(k)),执行步骤8,else执行步骤9;步骤8:计算编号flag的碎纸片右侧与剩余类内未拼接碎纸片左侧的相似度,记为Sflag,j,求出j*号碎纸片拼接在flag号碎纸片右侧,更新flag和i,flag=j*,i=i+1,转向步骤7;步骤9:根据语义、字形和拼接效果,调整个别错碎纸片的顺序,得到每一类的拼接结果矩阵,记为subPi;步骤10:每个灰度矩阵subPi的第一行和最后一行分别记为firstRowi和lastRowi,firstRowi=subPi(1,:),lastRowi=subPi(end,:);步骤11:求得最顶部碎纸片,计算每个灰度矩阵subPi前m行的灰度值之和grayi,最左边碎纸片的编号为flag为已拼接碎纸片最底部的碎纸片编号,flag=i*;步骤12:初始化i=1,ifi<=10,执行步骤13,else执行步骤14;步骤13:计算编号flag的碎纸条底部与剩余未拼接碎纸条顶部的相似度,记为Sflag,j,j*号碎纸片拼接在flag号碎纸条下侧,更新flag和i,flag=j*,i=i+1,转向步骤12;步骤14:显示拼接好的碎纸片图像。本专利技术根据文字特征对碎纸片做了二值化、水平投影、字符字块填补等预处理。然后,采用模糊C均值聚类算法,对预处理好的碎纸片进行分类处理。再根据横向拼接模型进行碎纸片横向拼接,最后根据纵向拼接模型进行纵向拼接,获得拼接原图。本专利技术提高了碎纸片分类的准确率,也有利于提高拼接的成功率和效率。附图说明图1为碎纸片图片(部分)。图2为应用本专利技术对图1拼接复原后的图像。具体实施方式下面通过实施例,并结合附图,对本专利技术作进一步具体的说明。实施例:步骤1:通过imread()函数读取19张碎纸片灰度值,每张碎纸片的灰度矩阵记为Pi,(i=1,...,19);步骤2:二值化处理灰度矩阵Pi,二值化处理后矩阵BPi=Pi./255;步骤3:每个灰度矩阵BPi的第一列和最后一列分别记为headi和reari,headi=BPi(:,1),reari=BP(:,end);步骤4:对每个灰度矩阵BPi进行字符、字块填补处理,然后再进行水平投影处理,结果记为shadow(i,:),shadow矩阵每一行表示一个灰度矩阵的投影向量,步骤5:采用模糊C均值聚类函数fcm()对shadow进行聚类,聚类结果记为index,index(k)记录着第k类的碎纸片编号;步骤6:求得每一类中的最左边碎纸片,计算每个灰度矩阵BPi前10列的灰度值之和grayi,最左边碎纸片的编号为flag为已拼接碎纸片最右边的碎纸片编号,flag=i*;步骤7:初始化i=1,ifi≤length(index(k)),执行步骤8,else执行步骤9;步骤8:计算编号flag的碎纸片右侧与剩余类内未拼接碎纸片左侧的相似度,记为Sflag,j,j*号碎纸片拼接在flag号碎纸片右侧,更新flag和i,flag=j*,i=i+1,转向步骤7;步本文档来自技高网
...

【技术保护点】
1.一种基于模糊C均值聚类的碎纸片拼接复原方法,其特征是,包括以下步骤:步骤1:通过图片读取函数imread()读取n张碎纸片灰度值,每张碎纸片的灰度矩阵记为Pi,(i=1,...,n);步骤2:二值化处理灰度矩阵Pi,二值化处理后矩阵BPi=Pi./S,S为阈值;步骤3:每个灰度矩阵BPi的第一列和最后一列分别记为headi和reari,headi=BPi(:,1),reari=BP(:,end);步骤4:首先对灰度矩阵BPi进行水平投影处理,结果记为shadow(i,:),shadow矩阵每一行表示一个灰度矩阵的投影向量,再对每个投影向量进行字符、字块的填补处理;步骤5:采用模糊C均值聚类函数fcm()对投影向量shadow进行聚类,聚类结果记为index,index(k)记录着第k类的碎纸片编号;步骤6:求得每一类中的最左边碎纸片,计算每个灰度矩阵BPi前m列的灰度值之和grayi,最左边碎纸片的编号为

【技术特征摘要】
1.一种基于模糊C均值聚类的碎纸片拼接复原方法,其特征是,包括以下步骤:步骤1:通过图片读取函数imread()读取n张碎纸片灰度值,每张碎纸片的灰度矩阵记为Pi,(i=1,...,n);步骤2:二值化处理灰度矩阵Pi,二值化处理后矩阵BPi=Pi./S,S为阈值;步骤3:每个灰度矩阵BPi的第一列和最后一列分别记为headi和reari,headi=BPi(:,1),reari=BP(:,end);步骤4:首先对灰度矩阵BPi进行水平投影处理,结果记为shadow(i,:),shadow矩阵每一行表示一个灰度矩阵的投影向量,再对每个投影向量进行字符、字块的填补处理;步骤5:采用模糊C均值聚类函数fcm()对投影向量shadow进行聚类,聚类结果记为index,index(k)记录着第k类的碎纸片编号;步骤6:求得每一类中的最左边碎纸片,计算每个灰度矩阵BPi前m列的灰度值之和grayi,最左边碎纸片的编号为flag为已拼接碎纸片最右边的碎纸片编号,flag=i*;步骤7:初始化i=1,ifi≤length(index(k)),执行步骤8,else...

【专利技术属性】
技术研发人员:周才英张盼杨帅彬
申请(专利权)人:江西理工大学
类型:发明
国别省市:江西,36

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1