文本处理方法、装置、电子设备和计算机可读存储介质制造方法及图纸

技术编号:38220762 阅读:9 留言:0更新日期:2023-07-25 17:52
本申请提供了一种文本处理方法、装置、电子设备和计算机可读存储介质,依据本申请实施例,首先基于目标文本的字体,确定对应的初始字体文件解析数据,并从初始字体文件解析数据中,读取目标文本的字形信息,再基于目标文本的字形信息,生成第一字体文件,最后基于第一字体文件显示目标文本。采用上述方案可以提升文本处理速度,且节约内存资源。另外,在初始字体文件解析数据中未读取到目标文本中某个文字对应的字形信息的情况下,还可以在至少一个补充字体文件解析数据中读取该文字对应的字形信息,由此可以在目标文本的字体的字形信息中不包含某一个生僻字时,使用其他字体的字形信息补充,使得基于第一字体文件显示的目标文本无遗漏。本无遗漏。本无遗漏。

【技术实现步骤摘要】
文本处理方法、装置、电子设备和计算机可读存储介质
[0001]相关申请的交叉引用
[0002]本申请要求于2022年06月14日提交中国专利局、申请号为202210673013.X、专利技术名称为“文本处理方法、装置、电子设备和计算机可读存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。


[0003]本申请涉及计算机
,尤其涉及一种文本处理方法、装置、电子设备和计算机可读存储介质。

技术介绍

[0004]在Logo(图形标识)设计、海报设计等图像处理场景中,经常需要在设计的图像中添加一些文本,并且往往使用多种字体呈现这些文本,以丰富图像的设计效果。
[0005]在图像或者其他文件中显示文本,需要用到字体文件,不同的字体对应不同的字体文件,一般来说,一个字体文件中包含了采用对应的字体的众多文字的字形信息。图像处理场景中需要用到多种字体,因此需要加载的字体文件也较多,存在加载缓慢、内存开销大等问题。
[0006]另外,由于不同的字体文件包含的文字数量不同,在需要用到某一种字体文件中的某一个生僻字的字形信息时,有些字体文件中可能不含有该生僻字的字形信息,易导致最终呈现的文本上对应该生僻字的位置出现空白或错误,影响图像的设计效果。

技术实现思路

[0007]本申请实施例提供一种文本处理方法、装置、电子设备和计算机可读存储介质,以解决上述一个或多个技术问题。
[0008]第一方面,本申请实施例提供了一种文本处理方法,包括:
[0009]基于目标文本的字体,确定对应的初始字体文件解析数据;
[0010]从所述初始字体文件解析数据中,读取所述目标文本的字形信息;
[0011]基于所述目标文本的字形信息,生成第一字体文件;
[0012]基于所述第一字体文件显示所述目标文本。
[0013]第二方面,本申请实施例提供了一种文本处理装置,包括:
[0014]数据确定模块,用于基于目标文本的字体,确定对应的初始字体文件解析数据;
[0015]字形读取模块,用于从所述初始字体文件解析数据中,读取所述目标文本的字形信息;
[0016]文件生成模块,用于基于所述目标文本的字形信息,生成第一字体文件;
[0017]文本显示模块,用于基于所述第一字体文件显示所述目标文本。
[0018]第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器在执行所述计算机程序时实现上述任一项所述的方法。
[0019]第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法。
[0020]与相关技术相比,本申请具有如下优点:
[0021]根据本申请实施例的方案,可以预先存储对应于各种字体的字体文件解析数据,在需要以某种字体显示目标文本时,基于该字体,确定对应的初始字体文件解析数据。再从字体文件解析数据中读取目标文本的字形信息,基于该字形信息生成第一字体文件。由于该第一字体文件是基于目标文本的字形信息生成的,数据量较少,因此,基于该字体文件显示目标文本,处理速度较快,且节约内存资源。
[0022]另外,在初始字体文件解析数据中未读取到目标文本中某个文字对应的字形信息的情况下,还可以在至少一个补充字体文件解析数据中读取该文字对应的字形信息,由此可以在目标文本的字体的字形信息中不包含某一个生僻字时,使用其他字体的字形信息补充,使得基于第一字体文件显示的目标文本无遗漏。
[0023]上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,可依照说明书的内容予以实施,并且为了让本申请的上述和其他目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
[0024]在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本申请的一些实施方式,而不应将其视为是对本申请范围的限制。
[0025]图1示出了本申请实施例中提供的文本处理方案的一个应用场景的示意图;
[0026]图2示出了本申请实施例中提供的文本处理方案的另一个应用场景的示意图;
[0027]图3示出了本申请实施例中提供的一种文本处理方法的流程图;
[0028]图4示出了本申请一个实施例中的ttf文件的结构的示意图;
[0029]图5示出了本申请一个实施例中的ttf文件中的数据域cmap的示意图;
[0030]图6示出了本申请一个实施例中的ttf文件中的数据域glyf的示意图;
[0031]图7示出了本申请实施例中提供的一种文本处理装置的结构框图;以及
[0032]图8示出了用来实现本申请实施例的电子设备的框图。
具体实施方式
[0033]在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本申请的构思或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的,而非限制性的。
[0034]为便于理解本申请实施例的技术方案,以下对本申请实施例的相关技术进行说明。以下相关技术作为可选方案与本申请实施例的技术方案可以进行任意结合,其均属于本申请实施例的保护范围。
[0035]相关技术中,提取文本的字形信息以显示文本的方式一般是从磁盘文件中的字库中直接读取字体文件,例如常用的ttf(TrueType Font,TrueType字体)文件。基于设定的代码直接从字体文件中提取字形信息。但此代码每次都会从磁盘文件读取完整的字体文件,
每次提取字形信息都是一次磁盘IO(Input/Output,输入输出),提取速度缓慢。
[0036]在读取字体文件后,将字体文件缓存在内存中,这样可以避免每次提取信息都进行磁盘IO,可以大幅提升速度。这种方式在使用的字体类型不多时,能够具有良好的性能表现。然而,在一些场景中,需要用到的字体类型较多,因此,需要加载的字体文件也较多,需要耗费大量的内存资源。特别在分布式系统中,由于每个机器都可能在内存中缓存数据,因此,内存资源尤为重要,因字形信息提取而导致大量内存开销并不是合适的方案。
[0037]另外,由于不同的字体文件包含的文字数量不同,在需要用到某一种字体文件中的某一个生僻字的字形信息时,有些字体文件中可能不含有该生僻字的字形信息,易导致最终呈现的文本上对应该生僻字的位置出现空白或错误,导致显示文本出现遗漏,影响文本的显示效果。
[0038]有鉴于此,本申请实施例提供了一种文本处理方法、装置、电子设备和计算机可读存储介质,以解决上述全部或部分技术问题。
[0039]图1是本申请实施例中提供的文本处理方案的一个应用场景的示意图。该应用场景为采用图像处理服务进行图像设计的场景。其中,图像本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本处理方法,包括:基于目标文本的字体,确定对应的初始字体文件解析数据;从所述初始字体文件解析数据中,读取所述目标文本的字形信息;基于所述目标文本的字形信息,生成第一字体文件;基于所述第一字体文件显示所述目标文本。2.根据权利要求1所述的方法,其中,所述目标文本的字形信息包括多个文字的字形信息,所述基于目标文本的字体确定对应的初始字体文件解析数据包括:查找与所述目标文本的字体对应的初始字体文件解析数据;所述从所述初始字体文件解析数据中,读取所述目标文本的字形信息包括:针对所述目标文本中各个文字,在所述初始字体文件解析数据中查找到与各个文字对应的字形信息的情况下,提取查找到的字形信息。3.根据权利要求1所述的方法,其中,还包括:在所述初始字体文件解析数据中未读取到某个文字对应的字形信息的情况下,将未读取到字形信息的文字作为目标文字,在至少一个补充字体文件解析数据中读取所述目标文字对应的字形信息。4.根据权利要求3所述的方法,其中,所述基于所述目标文本的字形信息,生成第一字体文件包括:基于从所述初始字体文件解析数据中读取的字形信息以及从所述至少一个补充字体文件解析数据中读取的字形信息,生成二进制形式的第一字体文件。5.根据权利要求1所述的方法,其中,所述字形信息包括表征文字对显示屏像素的占用信息,所述基于所述目标文本的字形信息,生成第一字体文件包括:根据所述目标文本的字体大小以及所述目标文本中各个文字对显示屏像素的占用信息,确定对所确定的字形信息的缩放比例,根据各个文字缩放后的字形信息组成第一字体文件。6.根据权利要求1所述的方法,其中,在基于目标文本的字体,确定对应的初始字体文件解析数据之前,所述方法还包括:解析第二字体文件,得到字体文件解析数据,并将字体文件解析数据存储在缓存设备中,所述字体文件解析数据至少包括所述初始字体文件解析数据。7.根据权利要求6所述的方法,其中,所述第二字体文件包括N个字体文件,N为大于或等于2的整数;所述解析第二字体文件,得到字体文件解析数据,包括:解析所述N个字体文件中的第i个字体文件,得到M个字的字形信息;其中,i为小于或等于N的正整数,M为大于或等于1的整数;解析所述N个字体文件中的第j个字体文件,得到L个字的字...

【专利技术属性】
技术研发人员:朱瑞贤郑学剑王霄魏强刘真涛
申请(专利权)人:阿里云计算有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1