水书单字的数据集构建、识别方法、装置、设备及介质制造方法及图纸

技术编号:38714639 阅读:19 留言:0更新日期:2023-09-08 14:57
本发明专利技术公开了一种水书单字的数据集构建、识别方法、装置、设备及介质。水书单字的数据集构建方法,包括:扫描水书图像并将其二值化;对水书图像进行垂直投影得到正弦拟合曲线,根据正弦拟合曲线对水书图像进行列切分得到水书文字列图像;对单个水书文字列图像进行水平投影以及行切分,得到水书单字;对水书单字进行聚类并为每个类别添加标签,得到水书单字的数据集。上述技术方案根据垂直投影的正弦拟合曲线对水书图像进行列切分、通过水平投影进行行切分,保证了水书单字的切分精度,然后利用聚类算法为水书单字添加标签,保证了聚类结果的准确性,在此基础上构建高质量的水书单字数据集。集。集。

【技术实现步骤摘要】
水书单字的数据集构建、识别方法、装置、设备及介质


[0001]本专利技术实施例涉及图像处理
,尤其涉及一种水书单字的数据集构建、识别方法、装置、设备及介质。

技术介绍

[0002]水书是记载水族人民生活习俗、原始信仰、天文历法等诸多方面内容的“百科全书”,水族文字是表意象形文字,其具有独特的文字价值,是中华民族宝贵的非物质文化遗产。随着科技的飞速发展,深度学习技术在象形文字识别、少数民族语言翻译等任务中均取得了良好的效果。深度学习技术的使用需要大量数据的驱动,但目前没有公开的水书单字数据集,虽然有部分公开的水书单字,但难以为深度学习模型的训练提供有效的支持,导致深度学习技术在水书古籍保护的应用受到限制,使人们在识别或翻译水书文字等任务中面临困难。

技术实现思路

[0003]本专利技术提供了一种水书单字的数据集构建、识别方法、装置、设备及介质,以实现水书单字的数据集构建和识别,有助于对水书的数字化管理。
[0004]第一方面,本专利技术实施例提供了一种水书单字的数据集构建方法,包括:
[0005]扫描水书图像并将水书图像二值化,水书图像中包括多个水书单字;
[0006]对水书图像进行垂直投影并根据垂直投影结果得到正弦拟合曲线,根据正弦拟合曲线对水书图像进行列切分,得到水书文字列图像;
[0007]对于单个水书文字列图像,对水书文字列图像进行水平投影,基于水平投影结果对水书文字列图像进行行切分,得到水书文字列图像中的水书单字;
[0008]基于聚类算法对水书图像中的水书单字进行聚类并为每个类别添加标签,得到水书单字的数据集。
[0009]第二方面,本专利技术实施例提供了一种水书单字识别方法,包括:
[0010]获取水书单字的数据集;
[0011]根据数据集训练识别模型;
[0012]将待识别的水书单字输入至识别模型,得到识别结果;
[0013]其中,数据集基于第一方面中任一所述的水书单字的数据集构建方法构建。
[0014]第三方面,本专利技术实施例提供了一种水书单字的数据集构建装置,包括:
[0015]处理模块,用于扫描水书图像并将水书图像二值化,水书图像中包括多个水书单字;
[0016]列切分模块,用于对水书图像进行垂直投影并根据垂直投影结果得到正弦拟合曲线,根据正弦拟合曲线对水书图像进行列切分,得到水书文字列图像;
[0017]行切分模块,用于对于单个水书文字列图像,对水书文字列图像进行水平投影,基于水平投影结果对水书文字列图像进行行切分,得到水书文字列图像中的水书单字;
[0018]分类模块,用于基于聚类算法对水书图像中的水书单字进行聚类并为每个类别添加标签,得到水书单字的数据集。
[0019]第四方面,本专利技术实施例提供了一种水书单字识别装置,包括:
[0020]获取模块,用于获取水书单字的数据集;
[0021]训练模块,用于根据数据集训练识别模型;
[0022]识别模块,用于将待识别的水书单字输入至识别模型,得到识别结果。
[0023]其中,数据集基于第一方面中任一所述的水书单字的数据集构建方法构建。
[0024]第五方面,本专利技术实施例提供了一种电子设备,包括:
[0025]至少一个处理器;以及
[0026]与至少一个处理器通信连接的存储器;其中,
[0027]存储器存储有可被所述至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行如第一方面中任一所述的水书单字的数据集构建方法或第二方面所述的水书单字识别方法。
[0028]第六方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面中任一所述的水书单字的数据集构建方法或如第二方面所述的水书单字识别方法。
[0029]本专利技术实施例提供了一种水书单字的数据集构建、识别方法、装置、设备及介质。首先扫描水书图像并将水书图像二值化,然后对水书图像进行垂直投影并根据垂直投影结果得到正弦拟合曲线,然后根据正弦拟合曲线对水书图像进行列切分,得到水书文字列图像,然后对于单个水书文字列图像,对水书文字列图像进行水平投影,基于水平投影结果对水书文字列图像进行行切分,得到水书文字列图像中的水书单字,最后基于聚类算法对水书图像中的水书单字进行聚类并为每个类别添加标签,得到水书单字的数据集。通过获取水书单字的数据集,根据数据集训练识别模型,将待识别的水书单字输入至识别模型,得到识别结果。通过上述技术方案,根据垂直投影的正弦拟合曲线对水书图像进行列切分、通过水平投影进行行切分,保证了水书单字的切分精度,然后利用聚类算法为水书单字添加标签,保证了聚类结果的准确性,在此基础上构建了水书单字数据集和识别模型,有助于更好的对水书进行数字化管理,推动了深度学习技术在水书识别、水书古籍机器翻译等任务中的应用,进一步提升了水书非物质文化遗产数字保护的效果。
[0030]应当理解,本部分所描述的内容并非旨在标识本专利技术实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其他特征将通过以下的说明书而变得容易理解。
附图说明
[0031]结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
[0032]图1为本专利技术实施例一提供的一种水书单字的数据集构建方法的流程图;
[0033]图2为本专利技术实施例一提供的一种水书图像二值化处理前后对比的示意图;
[0034]图3为本专利技术实施例二提供的一种水书单字的数据集构建方法的流程图;
[0035]图4为本专利技术实施例二提供的一种水书图像垂直投影结果的示意图;
[0036]图5为本专利技术实施例三提供的一种水书单字的数据集构建方法的流程图;
[0037]图6为本专利技术实施例三提供的一种将字块与距离最近的下方相邻字块合并的示意图;
[0038]图7为本专利技术实施例三提供的一种水书单字切分可视化结果的示意图;
[0039]图8为本专利技术实施例三提供的一种水书图像聚类结果的示意图;
[0040]图9为本专利技术实施例三提供的一种水书单字图像集合的示意图;
[0041]图10为本专利技术实施例四提供的一种水书单字识别方法的流程图;
[0042]图11为本专利技术实施例五提供的一种水书单字的数据集构建装置的结构示意图;
[0043]图12为本专利技术实施例六提供的一种水书单字识别装置的结构示意图;
[0044]图13为本专利技术实施例七提供的一种电子设备的结构示意图。
具体实施方式
[0045]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。此外,在不冲突的情况下,本专利技术中的实施例及实施例中的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种水书单字的数据集构建方法,其特征在于,包括:扫描水书图像并将所述水书图像二值化,所述水书图像中包括多个水书单字;对所述水书图像进行垂直投影并根据垂直投影结果得到正弦拟合曲线,根据所述正弦拟合曲线对所述水书图像进行列切分,得到水书文字列图像;对于单个所述水书文字列图像,对所述水书文字列图像进行水平投影,基于水平投影结果对所述水书文字列图像进行行切分,得到所述水书文字列图像中的水书单字;基于聚类算法对所述水书图像中的水书单字进行聚类并为每个类别添加标签,得到水书单字的数据集。2.根据权利要求1所述的方法,其特征在于,对所述水书图像进行垂直投影并根据垂直投影结果得到正弦拟合曲线,包括:对于所述水书图像中的每一列像素,将该列中全部不为0的像素值累加,得到所述水书图像中各列的像素累加值;根据所述水书图像中各列的像素累加值绘制直方图;对所述直方图进行拟合,得到正弦拟合曲线。3.根据权利要求2所述的方法,其特征在于,根据所述正弦拟合曲线对所述水书图像进行列切分,得到水书文字列图像,包括:检测所述正弦拟合曲线的波谷,将所述波谷对应的像素列位置作为切分点对所述水书图像进行列切分,得到的每个图像块作为一个水书文字列图像。4.根据权利要求1所述的方法,其特征在于,对所述水书文字列图像进行水平投影,基于水平投影结果对所述水书文字列图像进行行切分,得到所述水书文字列图像中的水书单字,包括:对于所述水书文字列图像中的每一行像素,将该行中全部不为0的像素值累加,得到所述水书文字列图像中各行的像素累加值;将所述水书文字列图像中像素累加值大于第一像素阈值的像素行位置作为起始点,像素累加值小于第二像素阈值的像素行位置作为终止点,对所述水书文字列图像进行行切分,得到的每个字块中各包含一个水书单字;其中,所述第一像素阈值为进入文字区域时对应的像素阈值,所述第二像素阈值为进入非文字区域时对应的像素阈值。5.根据权利要求1所述的方法,其特征在于,基于水平投影结果对所述水书文字列图像进行行切分,得到所述水书文字列图像中的水书单字,包括:基于水平投影结果对所述水书文字列图像进行第一次行切分;若第一次行切分得到的任意一个字块的高度大于第一设定阈值,则对所述字块进行再次水平投影并基于再次水平投影的结果对所述字块进行再次行切分;重复执行上述再次行切分的操作,直至再次行切分得到的全部字块的高度均小于或等于所述第一设定阈值,得到的每个字块中各包含一个水书单字;其中,所述第一设定阈值根据第一次行切分的平均切分高度确定。6.根据权利要求1所述的方法,其特征在于,基于水平投影结果对所述水书文字列图像进行行切分,得到所述水书文字列图像中的水书单字,包括:基于水平投影结果对所述水书文字列图像进行行切分;
若行切分得到的任意一个字块的高度小于第二设定阈值,则将所述字块与相邻字块合并;在所述水书文字列图像中各字块的高度均大于或等于第二设定阈值的情况下,得到的每个字块中各包含一个水书单字;其中,所述第二设定阈值根据第一次行切分的平均切分高度确定。7....

【专利技术属性】
技术研发人员:毕晓君韩璐
申请(专利权)人:中央民族大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1