一种相似字体的确定方法、装置、电子设备及存储介质制造方法及图纸

技术编号:30883713 阅读:21 留言:0更新日期:2021-11-22 20:21
本发明专利技术实施例提供了一种相似字体的确定方法、装置、电子设备及存储介质,所述方法包括:获取目标图像,其中,目标图像中包括目标字符;确定目标图像中目标字符的外接矩形框区域的图像特征,作为目标特征;对目标图像进行字符识别,得到目标图像中包括的目标字符;从预先建立的字体特征数据库中查找目标字符对应的字体图像特征,作为候选特征,其中,字体特征数据库包括各个字符与各种字体的该字符的图像的图像特征的对应关系;基于目标特征与每个候选特征的相似度,确定目标字符的相似字体。应用本发明专利技术实施例,可以使应用相似字体的字符的外观与目标字符的外观更加接近。的外观与目标字符的外观更加接近。的外观与目标字符的外观更加接近。

【技术实现步骤摘要】
一种相似字体的确定方法、装置、电子设备及存储介质


[0001]本专利技术涉及图像处理
,特别是涉及一种相似字体的确定方法、装置、电子设备及存储介质。

技术介绍

[0002]用户在文档撰写、图像编辑等过程中,可能会存在使用与目标字体相同或相似字体的需求,例如,用户在看到一张图像中字符A后,可能想要使用与字符A的字体相同或相似的字体。当由于字体版权等原因导致用户无法使用与目标字体相同的字体时,为了满足用户的需求,需要确定与目标字体相似的字体,进而将该相似的字体推荐给用户使用。
[0003]目前的相似字体的确定方式是基于字体分类实现的。具体来说,电子设备首先获取包含目标字符的待处理图像,然后将待处理图像输入字体分类模型,根据待处理图像的图像特征进行字体分类,确定待处理图像中的目标字符的字体类别,进而将该字体类别中包括的字体中的一种字体确定为目标字体的相似字体。其中,同一字体类别包括的各种字体为相似的字体。
[0004]在上述相似字体的确定方式中,同一字体类别包括的相似字体为预先设置的。但是,对于不同的字符,在应用同一字体类别包括的字体时其外观可能会出现较大差异,例如,宋体与仿宋体属于同一字体类别,但是对于不同字符,应用宋体时的外观和应用仿宋体时的外观差异可能较大,例如,宋体的“我”字与仿宋体的“我”字外观差异较大,反而宋体的“我”字与楷体的“我”字外观差异较小,但宋体与楷体并不属于同一字体类别。在这种情况下,上述相似字体确定方式所确定的相似字体,应用于字符后,该字符的外观很可能与目标字符的外观差异较大

技术实现思路

[0005]本专利技术实施例的目的在于提供一种相似字体的确定方法、装置、电子设备及存储介质,以使应用相似字体的字符的外观与目标字符的外观更加接近。具体技术方案如下:
[0006]第一方面,本专利技术实施例提供了一种相似字体的确定方法,所述方法包括:
[0007]获取目标图像,其中,所述目标图像中包括目标字符;
[0008]确定所述目标图像中所述目标字符的外接矩形框区域的图像特征,作为目标特征;
[0009]对所述目标图像进行字符识别,得到所述目标图像中包括的目标字符;
[0010]从预先建立的字体特征数据库中查找所述目标字符对应的字体图像特征,作为候选特征,其中,所述字体特征数据库包括各个字符与各种字体的该字符的图像的图像特征的对应关系;
[0011]基于所述目标特征与每个所述候选特征的相似度,确定所述目标字符的相似字体。
[0012]可选的,所述确定所述目标图像中所述目标字符的外接矩形框区域的图像特征,
作为目标特征的步骤,包括:
[0013]对所述目标图像进行二值化处理,得到二值化图像;
[0014]根据所述二值化图像中像素点的像素值,确定所述二值化图像中所述目标字符的外接矩形框区域;
[0015]基于所述外接矩形框区域中每行或每列像素点的像素值,确定所述外接矩形框区域的图像特征,作为目标特征。
[0016]可选的,所述字体特征数据库的建立方式包括:
[0017]获取多个图像样本,其中,所述图像样本为各种字体的各字符的图像;
[0018]对每个所述图像样本进行二值化处理,得到二值化图像样本;
[0019]根据每个所述二值化图像样本中像素点的像素值,确定每个所述二值化图像样本包括的字符的外接矩形框区域;
[0020]基于每个所述外接矩形框区域中每行或每列像素点的像素值,确定每个所述外接矩形框区域的图像特征,作为每个所述图像样本对应的字体图像特征;
[0021]将每个所述图像样本对应的字体图像特征与每个所述图像样本包括的字符对应保存,得到所述字体特征数据库。
[0022]可选的,所述将每个所述图像样本对应的字体图像特征与每个所述图像样本包括的字符对应保存,得到字体特征数据库的步骤,包括:
[0023]按照预设的字体顺序,将包含相同字符的所述图像样本对应的字体图像特征作为元素,组成包含相同字符的所述图像样本对应的行向量或列向量;
[0024]按照预设的字符顺序,将所述行向量或所述列向量组成字体图像特征矩阵,得到所述字体特征数据库;
[0025]所述从预先建立的字体特征数据库中查找所述目标字符对应的字体图像特征,作为候选特征的步骤,包括:
[0026]从所述字体图像特征矩阵中查找所述目标字符对应的向量,作为候选特征。
[0027]可选的,在所述基于所述外接矩形框区域中每行或每列像素点的像素值,确定所述外接矩形框区域的图像特征,作为目标特征的步骤之前,所述方法还包括:
[0028]通过下采样或插值的方式将所述外接矩形框区域中像素点的行数量及列数量分别调整至对应的预设数量;
[0029]在所述基于每个所述外接矩形框区域样本中每行或每列像素点的像素值,确定每个所述外接矩形框区域样本的图像特征,作为每个所述图像样本对应的字体图像特征的步骤之前,所述方法还包括:
[0030]通过下采样或插值的方式将所述外接矩形框区域样本中像素点的行及列数量分别调整至对应的预设数量。
[0031]可选的,所述目标图像为用户提供的图像;
[0032]在所述基于所述目标特征与每个所述候选特征的相似度,确定所述目标字符的相似字体的步骤之后,所述方法还包括:
[0033]向所述用户推荐所述相似字体。
[0034]第二方面,本专利技术实施例提供了一种相似字体的确定装置,所述装置包括:
[0035]图像获取模块,用于获取目标图像,其中,所述目标图像中包括目标字符;
[0036]目标特征确定模块,用于确定所述目标图像中所述目标字符的外接矩形框区域的图像特征,作为目标特征;
[0037]字符识别模块,用于对所述目标图像进行字符识别,得到所述目标图像中包括的目标字符;
[0038]候选特征确定模块,用于从预先建立的字体特征数据库中查找所述目标字符对应的字体图像特征,作为候选特征,其中,所述字体特征数据库为通过数据库建立模块建立的,包括各个字符与各种字体的该字符的图像的图像特征的对应关系;
[0039]相似字体确定模块,用于基于所述目标特征与每个所述候选特征的相似度,确定所述目标字符的相似字体。
[0040]可选的,所述目标特征确定模块包括:
[0041]第一二值化处理子模块,用于对所述目标图像进行二值化处理,得到二值化图像;
[0042]第一矩形框区域确定子模块,用于根据所述二值化图像中像素点的像素值,确定所述二值化图像中所述目标字符的外接矩形框区域;
[0043]目标特征确定子模块,用于基于所述外接矩形框区域中每行或每列像素点的像素值,确定所述外接矩形框区域的图像特征,作为目标特征。
[0044]可选的,所述数据库建立模块包括:
[0045]图像样本获取子模块,用于获取多个图像样本,其中,所述图像样本为各种字体的各字符的图像;
[004本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种相似字体的确定方法,其特征在于,所述方法包括:获取目标图像,其中,所述目标图像中包括目标字符;确定所述目标图像中所述目标字符的外接矩形框区域的图像特征,作为目标特征;对所述目标图像进行字符识别,得到所述目标图像中包括的目标字符;从预先建立的字体特征数据库中查找所述目标字符对应的字体图像特征,作为候选特征,其中,所述字体特征数据库包括各个字符与各种字体的该字符的图像的图像特征的对应关系;基于所述目标特征与每个所述候选特征的相似度,确定所述目标字符的相似字体。2.根据权利要求1所述的方法,其特征在于,所述确定所述目标图像中所述目标字符的外接矩形框区域的图像特征,作为目标特征的步骤,包括:对所述目标图像进行二值化处理,得到二值化图像;根据所述二值化图像中像素点的像素值,确定所述二值化图像中所述目标字符的外接矩形框区域;基于所述外接矩形框区域中每行或每列像素点的像素值,确定所述外接矩形框区域的图像特征,作为目标特征。3.根据权利要求2所述的方法,其特征在于,所述字体特征数据库的建立方式包括:获取多个图像样本,其中,所述图像样本为各种字体的各字符的图像;对每个所述图像样本进行二值化处理,得到二值化图像样本;根据每个所述二值化图像样本中像素点的像素值,确定每个所述二值化图像样本包括的字符的外接矩形框区域;基于每个所述外接矩形框区域中每行或每列像素点的像素值,确定每个所述外接矩形框区域的图像特征,作为每个所述图像样本对应的字体图像特征;将每个所述图像样本对应的字体图像特征与每个所述图像样本包括的字符对应保存,得到所述字体特征数据库。4.根据权利要求3所述的方法,其特征在于,所述将每个所述图像样本对应的字体图像特征与每个所述图像样本包括的字符对应保存,得到字体特征数据库的步骤,包括:按照预设的字体顺序,将包含相同字符的所述图像样本对应的字体图像特征作为元素,组成包含相同字符的所述图像样本对应的行向量或列向量;按照预设的字符顺序,将所述行向量或所述列向量组成字体图像特征矩阵,得到所述字体特征数据库;所述从预先建立的字体特征数据库中查找所述目标字符对应的字体图像特征,作为候选特征的步骤,包括:从所述字体图像特征矩阵中查找所述目标字符对应的向量,作为候选特征。5.根据权利要求2所述的方法,其特征在于,在所述基于所述外接矩形框区域中每行或每列像素点的像素值,确定所述外接矩形框区域的图像特征,作为目标特征的步骤之前,所述方法还包括:通过下采样或插值的方式将所述外接矩形框区域中像素点的行数量及列数量分别调整至对应的预设数量;在所述基于每个所述外接矩形框区域样本中每行或每列像素点的像素值,确定每个所
述外接矩形框区域样本的图像特征,作为每个所述图像样本对应的字体图像特征的步骤之前,所述方法还包括:通过下采样或插值的方式将所述外接矩形框区域样本中像素点的行及列数量分别调整至对应的预设数量。6.根据权利要求1-5任一项所述的方法,其特征在于,所述目标图像为用户提供的图像;在所述基于所述目标特征与每个所述候选特征的相似度,确定所述目标字符的相似字体的步骤之后,所述方法还包括:向所述用户推荐所述相似字体。7.一种相似字体的确定装置,其特征在于,所述装置包括:图像获取模块,用于获取目标图像,其中,所述目标图像中包括目标字符;目标特征确定模块,用于确定所述目标图像中所述目标字符的外接矩形框区域的图像特征,作为目标特征;字符识别模块,用于对所述目标图像进行字符识别,得到所述目标图像中包括的目标字符;候选特征确定模块,用于从预先建立的...

【专利技术属性】
技术研发人员:陆瑾熊龙飞陈帝光
申请(专利权)人:武汉金山办公软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1