【技术实现步骤摘要】
改进FANnet生成网络的图像字符编辑方法
本专利技术属于图像识别
,特别是涉及一种改进FANnet生成网络的图像字符编辑方法。
技术介绍
当今国际化社会,作为国际通用语言的英文字符出现在众多公共场合;与英文字符具有相同几何结构特征的拼音字符也很重要。当这些字符出现在图像中,尤其图像风格复杂时,难以直接对其进行编辑修改。字体风格迁移与文字生成是人工智能的一个重要研究领域。不论是实景图还是电子效果图,总包含有大量文字信息。这些文字信息可以帮助读者更好理解图像中的上下文语义和场景信息。与文本中修改编辑文字不同,当一幅图像中的文字发生错误或需要修改时,直接在原图中进行修改非常困难。例如,一幅图像包含的有限文字中,可以提取的视觉信息数据不满足生成模型所需条件;在不同自然场景下,图像往往呈现出不同特征:亮度、对比度、阴影、透视形变和背景复杂度等。文字字体设计要求数据集内每一种文字的风格相同且具视觉一致性,建立这样的数据集往往需要消耗大量的人力和物力。如何通过有限规模的字符集,使计算机自动生成与源字符具有相同物理结构和视觉效果的其他字符是当前的研究热点。研究人员对图像文字的研究主要集中于文字识别方向,2005年,杨志华等人提出一种基于经验模式分解的汉字识别方法,通过对汉字常用笔画精简,做EMD分析,从而提出特征识别汉字。2011年,易剑等人提出一种基于颜色聚类和多帧融合的视频文字识别方法,2017年,丁明宇等人提出一种将深度学习和OCR相融合的一种商品参数文字检测方法。而针对文字生成研究领域,最先采用的是基于几何特 ...
【技术保护点】
1.改进FANnet生成网络的图像字符编辑方法,其特征在于,所述方法包括以下步骤:/n(1)从图像中选择欲替换的源字母,并通过HC显著性检测算法和自定义阈值分割算法的自适应目标检测模型提取源字母的二值图;/n(2)通过FANnet生成网络生成与源字符字体结构一致的目标字符二值图。;/n(3)通过基于颜色复杂度的自适应局部颜色迁移模型对已得目标二值图进行颜色迁移后将源字母替换为生成字母。/n
【技术特征摘要】
1.改进FANnet生成网络的图像字符编辑方法,其特征在于,所述方法包括以下步骤:
(1)从图像中选择欲替换的源字母,并通过HC显著性检测算法和自定义阈值分割算法的自适应目标检测模型提取源字母的二值图;
(2)通过FANnet生成网络生成与源字符字体结构一致的目标字符二值图。;
(3)通过基于颜色复杂度的自适应局部颜色迁移模型对已得目标二值图进行颜色迁移后将源字母替换为生成字母。
2.根据权利要求1所述的字符编辑方法,其特征在于,步骤(1)中自适应目标检测模型为:
Δ(T)=Sr(THC)-Sr(TB)(7)
式中,IHC代表原图I经过HC算法处理后的的二值图;IB代表区域Ω的二值图,T代表区域Ω内的一个连通分量,Sr(.)代表对区域Ω经过源字母提取后的最小边界框,BT为连通分量的最小边界值;
源字母二值图定义为:
图像If包含选定区域Ω内所有的字母二值图。IM代表原图I经过MSER算法处理后得到的二值图;⊙代表矩阵的元素积。
3.根据权利要求2所述的字符编辑方法,其特征在于,基于颜色直方图对比度(HC)的目标检测算法为:
首先,将区域Ω规则化为Ω’作为HC的输入:
式中,map(.)分别代表区域Ω’;P代表区域Ω的四个定点坐标值,
在区域Ω’内有:
式中,R(.)表示颜色ci在区域Ω’内的显著值;n为区域Ω’内所含的颜色总数,wj表示颜色cj的权重,Dis(ci,cj)表示颜色ci和cj在CIEL*a*b*空间内的颜色距离度量,具体表示为:
式中,num(.)表示cj在区域Ω’出现的次数;表示cj在CIEL*a*b*空间中第k个分量的值;
使用平滑操作将相似颜色的显著值进行加权平均成为一个颜色集:
式中,表示颜色c与它相似值最高的k个颜色的距离度量,k取n的25%;
最后将颜色集的显著值按照其在空间像素点的实际位置还原提取出区域Ω’中的显著性目标,采用高斯滤波和像素值归一化对结果图进行平滑操作,减少噪声,得到经过HC操作后的字母灰度图后,采用OTSU算法对其进行二值化处理,得到二值掩码图IHC。
4.根据权利要求1所述的字符编辑方法,其特征在于,步骤(2)包括图像预处理,采用填充操作使获得相同横纵比mθ×mθ,其中,mθ=max(hθ,wθ),hθ和wθ分别代表边界框Bθ的长和宽;max(.)代表取二者较大值,即沿x轴和y轴分别用px和py填充生成规则化二值图Iθ。其中,px和py满足:
随后,对Iθ进行缩放操作,使其维度为64×64。
5.根据权利要求4所述的字符编辑方法,其特征在于,字体自适应生成神经网络含有两个不同的输入,分别是尺寸为64×64的源字母二值图和目标字母的标签,在网络的编码部分,输入的源字母图像通过滤波器分别为16、16和1的3个卷积层...
【专利技术属性】
技术研发人员:刘尚旺,李名,刘国奇,袁培燕,孙林,
申请(专利权)人:河南师范大学,
类型:发明
国别省市:河南;41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。