当前位置: 首页 > 专利查询>湘潭大学专利>正文

一种基于极限学习机的碎纸片拼接复原方法及系统技术方案

技术编号:20076977 阅读:25 留言:0更新日期:2019-01-15 01:12
本发明专利技术公开一种基于极限学习机的碎纸片拼接复原方法及系统。方法包括:获取待拼接的碎纸片训练样本;提取训练样本的左右边界特征数据;根据左右边界特征数据训练极限学习机神经网络模型,得到训练好的神经网络模型;获取待拼接的碎纸片测试样本;提取测试样本的左右边界特征数据;选取首张待拼接碎纸片;通过训练好的神经网络模型选取与首张待拼接碎纸片吻合度最高的碎纸片;判断吻合度最高的碎纸片与首张待拼接碎纸片是否拼接正确;若是,对碎纸片进行拼接直至所有碎纸片拼接复原;若否,采用人工标记,继续通过训练好的神经网络模型选取与首张待拼接碎纸片吻合度最高的碎纸片。采用本发明专利技术的方法或系统能够快速、良好的实现碎纸片拼接复原效果。

A Method and System for Recovery of Fragments Stitching Based on Extreme Learning Machine

The invention discloses a method and a system for splicing and restoring fragments based on an extreme learning machine. The methods include: obtaining the training samples of fragments to be stitched; extracting the left and right boundary feature data of training samples; training the neural network model of extreme learning machine based on the left and right boundary feature data to get the trained neural network model; obtaining the test samples of fragments to be stitched; extracting the left and right boundary feature data of test samples; selecting the first fragments to be stitched; and training them. The trained neural network model chooses the fragments with the highest coincidence with the first fragments to be spliced; judges whether the fragments with the highest coincidence coincide with the first fragments to be spliced correctly; if so, splices the fragments until all the fragments are spliced and restored; if not, uses the artificial marker, continues to select the kiss with the first fragments to be spliced through the trained neural network model. The most suitable pieces of paper. The method or system of the invention can quickly and well realize the effect of splicing and restoring fragments.

【技术实现步骤摘要】
一种基于极限学习机的碎纸片拼接复原方法及系统
本专利技术涉及人工智能中机器学习领域,特别是涉及一种基于极限学习机的碎纸片拼接复原方法及系统。
技术介绍
随着计算机的普及和迅猛发展,大量复杂劳累的工作被计算机取而代之,尤其是最近这几年基于神经网络的人工智能的兴起,计算机已经影响着我们生活的方方面面。人工智能的快速发展得益于互联网产生的大数据以及计算机性能的提升,目前业界常用的卷积神经网络CNN,循环神经网络等都需要大量的数据对模型进行大量的训练来使得模型的泛化能力更强,但是现实生活中存在很多样本数量极少的例子,无法使用常规的神经网络进行大量训练,所以寻找一种小样本且具备一定泛化性能的算法具有重要的研究意义。碎纸片的拼接复原模型在文档安全保护、司法物证复原、历史文献修复以及军事情报获取等领域都有着十分重要的应用。碎纸片复原问题两种情况,一种是撕毁方式下的边缘不规则碎纸片,这种情况下通过边缘不规则轮廓匹配进行拼接和复原,复原难度较低还原率较高,本文不做讨论。另一种是碎纸机切割的边缘规则的破碎纸片,由于边缘形状一样无法通过轮廓进行匹配只能提取边缘特征进行匹配,只能通过图形边缘特征提取进行匹配,找到匹配程度较高的纸条进行拼接。传统地,由人工完成的碎纸片拼接与复原工作效率是很低的,从而,研究如何利用计算机技术准确快速地完成碎纸片的拼接与复原成为一项十分重要且有意义的工作,对该场景的研究和实践对小样本机器学习以及图片特征提取提供了一种可行的具有创新性的想法,对类似场景算法实现提供了参考依据。传统神经网络中的所有参数都需要调整以达到目标输出解最优,但这种调整需要以基于梯度下降误差反向传播算法不断迭代,显然,这种方法的学习速度非常缓慢。
技术实现思路
本专利技术的目的是提供一种基于极限学习机的碎纸片拼接复原方法及系统,能够快速、良好的实现碎纸片拼接复原效果。为实现上述目的,本专利技术提供了如下方案:一种基于极限学习机的碎纸片拼接复原方法,所述方法包括:获取待拼接的碎纸片训练样本;提取所述碎纸片训练样本的左右边界特征数据;根据所述左右边界特征数据训练极限学习机神经网络模型,得到训练好的神经网络模型;获取待拼接的碎纸片测试样本;提取所述碎纸片测试样本的左右边界特征数据;根据首张拼接原则选取一张碎纸片作为首张待拼接碎纸片;通过所述训练好的神经网络模型选取与所述首张待拼接碎纸片吻合度最高的碎纸片;判断所述吻合度最高的碎纸片与所述首张待拼接碎纸片是否拼接正确;若是,则对碎纸片进行拼接直至所有所述碎纸片拼接复原;若否,则采用人工标记,继续通过所述训练好的神经网络模型选取与所述首张待拼接碎纸片吻合度最高的碎纸片。可选的,所述提取所述碎纸片训练样本的左右边界特征数据,具体包括:对所述碎纸片训练样本进行二值化处理,得到一序列像素矩阵;将所述像素矩阵信息和所述碎纸片训练样本的文字信息进行组合,得到所述碎纸片的左右边界特征数据;所述碎纸片的左右边界特征数据用公式表示,其中,ai表示边缘像素值,ai等于0或者255。可选的,所述根据首张拼接原则为选择左边界为白边的碎纸片作为拼接行的首张碎纸片。可选的,所述根据所述左右边界特征数据训练极限学习机神经网络模型,得到训练好的神经网络模型,具体包括:将所述左右边界特征数据作为极限学习机神经网络模型的输入,得到输出数据;判断所述输出数据是否在误差范围阈值内;若是,确定所述神经网络模型为训练好的神经网络模型;若否,调整所述神经网络模型的参数权值,使所述输出数据在所述误差范围阈值内,得到训练好的神经网络模型。为实现上述目的,本专利技术提供了如下方案:一种基于极限学习机的碎纸片拼接复原系统,所述系统包括:训练样本获取模块,用于获取待拼接的碎纸片训练样本;训练样本特征提取模块,用于提取所述碎纸片训练样本的左右边界特征数据;训练模块,用于根据所述左右边界特征数据训练极限学习机神经网络模型,得到训练好的神经网络模型;测试样本获取模块,用于获取待拼接的碎纸片测试样本;测试样本特征提取模块,用于提取所述碎纸片测试样本的左右边界特征数据;首张拼接碎纸片选取模块,用于根据首张拼接原则选取一张碎纸片作为首张待拼接碎纸片;吻合度计算模块,用于通过所述训练好的神经网络模型选取与所述首张待拼接碎纸片吻合度最高的碎纸片;判断模块,用于判断所述吻合度最高的碎纸片与所述首张待拼接碎纸片是否拼接正确;若是,则对碎纸片进行拼接,直至所有所述碎纸片拼接复原;若否,则采用人工标记,继续通过所述训练好的神经网络模型选取与所述首张待拼接碎纸片吻合度最高的碎纸片。可选的,所述训练样本特征提取模块,具体包括:二值化处理单元,用于对所述碎纸片训练样本进行二值化处理,得到一序列像素矩阵;左右边界特征数据提取单元,用于将所述像素矩阵信息和所述碎纸片训练样本的文字信息进行组合,得到所述碎纸片的左右边界特征数据;所述碎纸片的左右边界特征数据用公式表示,其中,ai表示边缘像素值,ai等于0或者255。可选的,所述根据首张拼接原则为选择左边界为白边的碎纸片作为拼接行的首张碎纸片。可选的,所述训练模块,具体包括:输出数据获取单元,用于将所述左右边界特征数据作为极限学习机神经网络模型的输入,得到输出数据;判断单元,用于判断所述输出数据是否在误差范围阈值内;若是,确定所述神经网络模型为训练好的神经网络模型;若否,调整所述神经网络模型的参数权值,使所述输出数据在所述误差范围阈值内,得到训练好的神经网络模型。根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:本专利技术提供一种基于极限学习机的碎纸片拼接复原方法,采用极限学习机神经网络模型,只需将模型中的部分参数进行调整,而是通过随机初始化输入层权值和偏置值开固定部分参数使问题转化为一元问题通过函数的方式进行求解,通过将上述极限学习机神经网络模型应用到碎纸片拼接复原中,能够迅速、良好的实现碎纸片的拼接。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例基于极限学习机的碎纸片拼接复原方法流程图;图2为本专利技术实施例设计极限学习机神经网络模型图;图3为本专利技术实施例边缘不规则的碎纸片示意图;图4为本专利技术实施例边缘规则的碎纸片示意图;图5为本专利技术实施例边缘特征特征展示图6为本专利技术实施例碎纸片特征分布可视化图;图7为本专利技术实施例文字类碎纸片组合特征示意图;图8为本专利技术实施例基于极限学习机的碎纸片拼接复原系统结构图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。图1为本专利技术实施例基于极限学习机的碎纸片拼接复原方法流程图。如图1所示,一种基于极限学习机的碎纸片拼接复原方法,所述方法包括:步骤101:获取待拼接的本文档来自技高网
...

【技术保护点】
1.一种基于极限学习机的碎纸片拼接复原方法,其特征在于,所述方法包括:获取待拼接的碎纸片训练样本;提取所述碎纸片训练样本的左右边界特征数据;根据所述左右边界特征数据,训练极限学习机神经网络模型,得到训练好的神经网络模型;获取待拼接的碎纸片测试样本;提取所述碎纸片测试样本的左右边界特征数据;根据首张拼接原则选取一张碎纸片作为首张待拼接碎纸片;通过所述训练好的神经网络模型选取与所述首张待拼接碎纸片吻合度最高的碎纸片;判断所述吻合度最高的碎纸片与所述首张待拼接碎纸片是否拼接正确;若是,则对碎纸片进行拼接直至所有所述碎纸片拼接复原;若否,则采用人工标记,继续通过所述训练好的神经网络模型选取与所述首张待拼接碎纸片吻合度最高的碎纸片。

【技术特征摘要】
1.一种基于极限学习机的碎纸片拼接复原方法,其特征在于,所述方法包括:获取待拼接的碎纸片训练样本;提取所述碎纸片训练样本的左右边界特征数据;根据所述左右边界特征数据,训练极限学习机神经网络模型,得到训练好的神经网络模型;获取待拼接的碎纸片测试样本;提取所述碎纸片测试样本的左右边界特征数据;根据首张拼接原则选取一张碎纸片作为首张待拼接碎纸片;通过所述训练好的神经网络模型选取与所述首张待拼接碎纸片吻合度最高的碎纸片;判断所述吻合度最高的碎纸片与所述首张待拼接碎纸片是否拼接正确;若是,则对碎纸片进行拼接直至所有所述碎纸片拼接复原;若否,则采用人工标记,继续通过所述训练好的神经网络模型选取与所述首张待拼接碎纸片吻合度最高的碎纸片。2.根据权利要求1所述的基于极限学习机的碎纸片拼接复原方法,其特征在于,所述提取所述碎纸片训练样本的左右边界特征数据,具体包括:对所述碎纸片训练样本进行二值化处理,得到一序列像素矩阵;将所述像素矩阵信息和所述碎纸片训练样本的文字信息进行组合,得到所述碎纸片的左右边界特征数据;所述碎纸片的左右边界特征数据用公式表示,其中,ai表示边缘像素值,ai等于0或者255。3.根据权利要求1所述的基于极限学习机的碎纸片拼接复原方法,其特征在于,所述根据首张拼接原则为选择左边界为白边的碎纸片作为拼接行的首张碎纸片。4.根据权利要求1所述的基于极限学习机的碎纸片拼接复原方法,其特征在于,所述根据所述左右边界特征数据训练极限学习机神经网络模型,得到训练好的神经网络模型,具体包括:将所述左右边界特征数据作为极限学习机神经网络模型的输入,得到输出数据;判断所述输出数据是否在误差范围阈值内;若是,确定所述神经网络模型为训练好的神经网络模型;若否,调整所述神经网络模型的参数权值,使所述输出数据在所述误差范围阈值内,得到训练好的神经网络模型。5.一种基于极限学习机的碎纸片拼接复原系统,其特征在于,所述系统包括:训练样本获取模...

【专利技术属性】
技术研发人员:邹娟张争辉伍兵曾令涛王求真郑金华
申请(专利权)人:湘潭大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1