水书单字的数据集构建、识别方法、装置、设备及介质制造方法及图纸

技术编号：38714639 阅读：19 留言：0更新日期：2023-09-08 14:57

本发明专利技术公开了一种水书单字的数据集构建、识别方法、装置、设备及介质。水书单字的数据集构建方法，包括：扫描水书图像并将其二值化；对水书图像进行垂直投影得到正弦拟合曲线，根据正弦拟合曲线对水书图像进行列切分得到水书文字列图像；对单个水书文字列图像进行水平投影以及行切分，得到水书单字；对水书单字进行聚类并为每个类别添加标签，得到水书单字的数据集。上述技术方案根据垂直投影的正弦拟合曲线对水书图像进行列切分、通过水平投影进行行切分，保证了水书单字的切分精度，然后利用聚类算法为水书单字添加标签，保证了聚类结果的准确性，在此基础上构建高质量的水书单字数据集。集。集。

全部详细技术资料下载

【技术实现步骤摘要】
水书单字的数据集构建、识别方法、装置、设备及介质

[0001]本专利技术实施例涉及图像处理
，尤其涉及一种水书单字的数据集构建、识别方法、装置、设备及介质。

技术介绍

[0002]水书是记载水族人民生活习俗、原始信仰、天文历法等诸多方面内容的“百科全书”，水族文字是表意象形文字，其具有独特的文字价值，是中华民族宝贵的非物质文化遗产。随着科技的飞速发展，深度学习技术在象形文字识别、少数民族语言翻译等任务中均取得了良好的效果。深度学习技术的使用需要大量数据的驱动，但目前没有公开的水书单字数据集，虽然有部分公开的水书单字，但难以为深度学习模型的训练提供有效的支持，导致深度学习技术在水书古籍保护的应用受到限制，使人们在识别或翻译水书文字等任务中面临困难。

技术实现思路

[0003]本专利技术提供了一种水书单字的数据集构建、识别方法、装置、设备及介质，以实现水书单字的数据集构建和识别，有助于对水书的数字化管理。
[0004]第一方面，本专利技术实施例提供了一种水书单字的数据集构建方法，包括：
[0005]扫描水书图像并将水书图像二值化，水书图像中包括多个水书单字；
[0006]对水书图像进行垂直投影并根据垂直投影结果得到正弦拟合曲线，根据正弦拟合曲线对水书图像进行列切分，得到水书文字列图像；
[0007]对于单个水书文字列图像，对水书文字列图像进行水平投影，基于水平投影结果对水书文字列图像进行行切分，得到水书文字列图像中的水书单字；
[0008]基于聚类算法对水书图...

【技术保护点】

【技术特征摘要】
1.一种水书单字的数据集构建方法，其特征在于，包括：扫描水书图像并将所述水书图像二值化，所述水书图像中包括多个水书单字；对所述水书图像进行垂直投影并根据垂直投影结果得到正弦拟合曲线，根据所述正弦拟合曲线对所述水书图像进行列切分，得到水书文字列图像；对于单个所述水书文字列图像，对所述水书文字列图像进行水平投影，基于水平投影结果对所述水书文字列图像进行行切分，得到所述水书文字列图像中的水书单字；基于聚类算法对所述水书图像中的水书单字进行聚类并为每个类别添加标签，得到水书单字的数据集。2.根据权利要求1所述的方法，其特征在于，对所述水书图像进行垂直投影并根据垂直投影结果得到正弦拟合曲线，包括：对于所述水书图像中的每一列像素，将该列中全部不为0的像素值累加，得到所述水书图像中各列的像素累加值；根据所述水书图像中各列的像素累加值绘制直方图；对所述直方图进行拟合，得到正弦拟合曲线。3.根据权利要求2所述的方法，其特征在于，根据所述正弦拟合曲线对所述水书图像进行列切分，得到水书文字列图像，包括：检测所述正弦拟合曲线的波谷，将所述波谷对应的像素列位置作为切分点对所述水书图像进行列切分，得到的每个图像块作为一个水书文字列图像。4.根据权利要求1所述的方法，其特征在于，对所述水书文字列图像进行水平投影，基于水平投影结果对所述水书文字列图像进行行切分，得到所述水书文字列图像中的水书单字，包括：对于所述水书文字列图像中的每一行像素，将该行中全部不为0的像素值累加，得到所述水书文字列图像中各行的像素累加值；将所述水书文字列图像中像素累加值大于第一像素阈值的像素行位置作为起始点，像素累加值小于第二像素阈值的像素行位置作为终止点，对所述水书文字列图像进行行切分，得到的每个字块中各包含一个水书单字；其中，所述第一像素阈值为进入文字区域时对应的像素阈值，所述第二像素阈值为进入非文字区域时对应的像素阈值。5.根据权利要求1所述的方法，其特征在于，基于水平投影结果对所述水书文字列图像进行行切分，得到所述水书文字列图像中的水书单字，包括：基于水平投影结果对所述水书文字列图像进行第一次行切分；若第一次行切分得到的任意一个字块的高度大于第一设定阈值，则对所述字块进行再次水平投影并基于再次水平投影的结果对所述字块进行再次行切分；重复执行上述再次行切分的操作，直至再次行切分得到的全部字块的高度均小于或等于所述第一设定阈值，得到的每个字块中各包含一个水书单字；其中，所述第一设定阈值根据第一次行切分的平均切分高度确定。6.根据权利要求1所述的方法，其特征在于，基于水平投影结果对所述水书文字列图像进行行切分，得到所述水书文字列图像中的水书单字，包括：基于水平投影结果对所述水书文字列图像进行行切分；
若行切分得到的任意一个字块的高度小于第二设定阈值，则将所述字块与相邻字块合并；在所述水书文字列图像中各字块的高度均大于或等于第二设定阈值的情况下，得到的每个字块中各包含一个水书单字；其中，所述第二设定阈值根据第一次行切分的平均切分高度确定。7....

【专利技术属性】
技术研发人员：毕晓君，韩璐，
申请(专利权)人：中央民族大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人