基于深度学习的细粒度字形匹配网络的汉字字形匹配方法及系统技术方案

技术编号:46620976 阅读:0 留言:0更新日期:2025-10-14 21:15
本发明专利技术公开了基于深度学习的细粒度字形匹配网络的汉字字形匹配方法及系统,方法如下:S1、获取含有微调水印的汉字图像,利用OCR技术进行图像预处理;S2、基于汉字类别信息,采用分层随机抽样策略构建支持集和目标集;S3、将步骤S2得到的支持集和目标集图像输入卷积神经网络中,提取字形嵌入特征向量;S4、构建支持集与目标集之间的标签掩码矩阵;S5、在特征空间中计算支持样本与目标样本之间的相似度矩阵;S6、基于标签掩码与相似度矩阵,构建并优化结合正负样本的层次距离损失函数,配合交叉熵损失进行卷积神经网络训练;S7、将训练好的网络用于待提取水印的图像中进行水印提取,通过支持集匹配结果输出目标图像对应的字形类别或水印位置信息。

【技术实现步骤摘要】

本专利技术属于图像处理与深度学习结合,具体涉及一种基于深度学习的细粒度字形匹配网络的汉字字形匹配方法及系统,应用于信息隐藏领域。


技术介绍

1、基于汉字结构微调的隐写技术是信息隐藏领域中一种较为通用的数字水印嵌入技术,主要用于泄密溯源等信息安全场景。信息隐藏技术是信息安全领域的重要研究方向,其中,文字隐写利用汉字文本作为信息载体,是隐写技术的重要分支,在版权保护、数据溯源及隐蔽通信等场景中发挥着关键作用。

2、在基于汉字结构微调的隐写技术中,首先会通过各种方式对汉字生成字形相似但略有不同的变体汉字。随后在嵌入流程中,可以将二进制化的数字水印和修改后的字形进行映射,从而实现信息隐藏。具体嵌入流程如下:首先将秘密信息转换为二进制编码流,构建水印嵌入基础;其次对载体汉字文本进行汉字频率分析,建立高频字优先的字符映射表,仅对高频汉字实施水印操作以提升系统效率;最后依据二进制编码对选定汉字的字形进行动态替换,同时通过编码冗余策略对关键水印位重复嵌入,并辅以纠错机制增强抗干扰能力。该方法在保持文本语义完整性的同时,利用汉字形态多样性完成水印隐蔽嵌入,这些微本文档来自技高网...

【技术保护点】

1.基于深度学习的细粒度字形匹配网络的汉字字形匹配方法,其特征在于,包括以下步骤:

2.根据权利要求1所述基于深度学习的细粒度字形匹配网络的汉字字形匹配的方法,其特征在于,步骤S1中,图像预处理包括汉字区域识别、图像灰度化、归一化、尺寸标准化及去噪操作。

3.根据权利要求1所述基于深度学习的细粒度字形匹配网络的汉字字形匹配的方法,其特征在于,步骤S2中,采用分层随机抽样策略构建支持集具体如下:从N个汉字类别中随机选取部分类别,对于每个选定的汉字类别,从其对应的V个字形变体类中随机抽取K个样本,构成支持集;

4.根据权利要求1所述基于深度学习的细粒度字形...

【技术特征摘要】

1.基于深度学习的细粒度字形匹配网络的汉字字形匹配方法,其特征在于,包括以下步骤:

2.根据权利要求1所述基于深度学习的细粒度字形匹配网络的汉字字形匹配的方法,其特征在于,步骤s1中,图像预处理包括汉字区域识别、图像灰度化、归一化、尺寸标准化及去噪操作。

3.根据权利要求1所述基于深度学习的细粒度字形匹配网络的汉字字形匹配的方法,其特征在于,步骤s2中,采用分层随机抽样策略构建支持集具体如下:从n个汉字类别中随机选取部分类别,对于每个选定的汉字类别,从其对应的v个字形变体类中随机抽取k个样本,构成支持集;

4.根据权利要求1所述基于深度学习的细粒度字形匹配网络的汉字字形匹配的方法,其特征在于,步骤s3中,所述卷积神经网络使用残差网络结构作为骨干网络,输入图像尺寸为112×112,卷积核大...

【专利技术属性】
技术研发人员:张祯赵治翔吴国华王秋华贾茜媛余宏陈李岩
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1