【技术实现步骤摘要】
字体识别方法、装置、电子设备及存储介质
[0001]本专利技术实施例涉及计算机领域,尤其涉及一种字体识别方法
、
装置
、
电子设备及存储介质
。
技术介绍
[0002]在一些应用场景中,用户在看到图片上的某种字体时,可能会想在自己的可编辑文档,例如
Word
文档
、PPT
文档上来应用该种字体
。
[0003]然而,若非专业人士,用户是无法直接通过视觉确定图片中文字所应用字体的,那么在无法知晓字体的情况下,用户也就无法使用该字体
。
[0004]对此,亟需一种能够识别图片中文字字体的技术方案
。
技术实现思路
[0005]鉴于此,为实现识别图片中文字的字体,本专利技术实施例提供一种字体识别方法
、
装置
、
电子设备及存储介质
。
[0006]第一方面,本专利技术实施例提供一种字体识别方法,包括:
[0007]确定待识别图片,所述待识别图片中包含多个文字;
[0008]从所述待识别图片中提取出多个单字图片,每个所述单字图片中包含一个所述文字;
[0009]确定每个所述单字图片中的所述文字对应的第一候选字体集;
[0010]基于每个所述单字图片中的所述文字对应的所述第一候选字体集,确定所述待识别图片中所述文字的字体
。
[0011]在一可能的实施方式中,所述确定每个所述单字图片中的所述文字对应的 ...
【技术保护点】
【技术特征摘要】
1.
一种字体识别方法,其特征在于,包括:确定待识别图片,所述待识别图片中包含多个文字;从所述待识别图片中提取出多个单字图片,每个所述单字图片中包含一个所述文字;确定每个所述单字图片中的所述文字对应的第一候选字体集;基于每个所述单字图片中的所述文字对应的所述第一候选字体集,确定所述待识别图片中所述文字的字体
。2.
根据权利要求1所述的方法,其特征在于,所述确定每个所述单字图片中的所述文字对应的第一候选字体集,包括:将每个所述单字图片分别输入至已训练的字体识别模型,得到每个所述单字图片对应的预测参数集,所述预测参数集中的预测参数包括字体以及所述单字图片中的文字应用所述字体的概率;基于每个所述单字图片对应的所述预测参数集,确定每个所述单字图片中的所述文字对应的第一候选字体集
。3.
根据权利要求2所述的方法,其特征在于,所述基于每个所述单字图片对应的所述预测参数集,确定每个所述单字图片中的所述文字对应的第一候选字体集,包括:针对每个所述单字图片执行以下处理:按照对应的所述概率从大到小的顺序,对所述单字图片对应的所述预测参数集中多种所述字体进行排序,得到第二字体序列;将所述第二字体序列中,排名前
N
位的所述字体作为候选字体,得到所述单字图片中的所述文字对应的第一候选字体集,所述
N
为正整数
。4.
根据权利要求1所述的方法,其特征在于,所述基于每个所述单字图片中的所述文字对应的所述第一候选字体集,确定所述文字的字体,包括:确定多个所述第一候选字体集的并集,并将所述并集确定为所述待识别图片对应的第二候选字体集;按照预设的排序机制对所述第二候选字体集中包括的多种候选字体进行排序,得到第一字体序列;基于所述第一字体序列确定所述待识别文字的字体
。5.
根据权利要求4所述的方法,其特征在于,所述按照预设的排序机制对所述第二候选字体集中包括的多种候选字体进行排序,得到第一字体序列,包括:确定所述第二候选字体集中的每种所述候选字体在多个所述第一候选字体集中的出现次数;若每种所述候选字体对应的所述出现次数各不相同,则按照对应的所述出现次数从大到小的顺序对所述第二候选字体集中的多种所述候选字体进行排序,得到第一字体序列;或者,若每种所述候选字体对应的所述出现次数均相同,则基于所述候选字体对应的多个概率对所述第二候选字体集中的多种...
【专利技术属性】
技术研发人员:林文松,
申请(专利权)人:北京金山办公软件股份有限公司武汉金山办公软件有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。