文字图像的生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号：38998519 阅读：9 留言：0更新日期：2023-10-07 10:30

本公开提供了一种文字图像的生成方法、装置、电子设备及存储介质，具体涉及计算机视觉、知识图谱和深度学习技术领域。具体实现方案为：获取文字图像生成请求，对生成请求中的源文字进行轮廓提取，获取源文字对应的轮廓图，然后确定源文字对应的扩展文本，之后基于扩展文本及轮廓图，生成源文字对应的文字图像。由此，既确保了生成图像的文字可读性，也提高了生成的文字图像的内容丰富度和创意性。生成的文字图像的内容丰富度和创意性。生成的文字图像的内容丰富度和创意性。

全部详细技术资料下载

【技术实现步骤摘要】
文字图像的生成方法、装置、电子设备及存储介质

[0001]本公开涉及人工智能
，尤其涉及计算机视觉、知识图谱、深度学习等
，具体涉及一种文字图像的生成方法、装置、电子设备及存储介质。

技术介绍

[0002]近年来，人工智能内容生成技术(AI
‑
Generated Content，AIGC)发展迅速，该技术能够大幅提升内容生产的质量与效率。其中，文本到图像的生成技术得到了尤其广泛的关注和应用，这项技术能够满足用户通过简单的文本描述，自动生成专业水平的精美画作的需求，在很多场合具有较高的利用价值，因此找到一种高效率、高质量的图像生成方法是目前亟待解决的问题。

技术实现思路

[0003]本公开提供了一种文字图像的生成方法、装置、电子设备及存储介质。
[0004]根据本公开的第一方面，提供了一种文字图像的生成方法，包括：
[0005]获取文字图像生成请求，其中，所述生成请求中包括源文字；
[0006]对所述源文字进行轮廓提取，获取所述源文字对应的轮廓图；
[0007]确定所述源文字对应的扩展文本；
[0008]基于所述扩展文本及所述轮廓图，生成所述源文字对应的文字图像。
[0009]根据本公开的第二方面，提供了一种文字图像的生成装置，包括：
[0010]第一获取模块，用于获取文字图像生成请求，其中，所述生成请求中包括源文字；
[0011]第二获取模块，用于对所述源文字进行轮廓提取，获取所述源文字对应的轮廓图；
>[0012]第一确定模块，用于确定所述源文字对应的扩展文本；
[0013]第一生成模块，用于基于所述扩展文本及所述轮廓图，生成所述源文字对应的文字图像。
[0014]根据本公开的第三方面，提供了一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行本公开第一方面所述的文字图像的生成方法。
[0015]根据本公开的第四方面，提出了一种存储有计算机指令的非瞬时计算机可读存储介质，计算机指令用于使计算机执行本公开第一方面所述的文字图像的生成方法。
[0016]根据本公开的第五方面，提出了一种计算机程序产品，包括计算机程序，当计算机程序由处理器执行时实现本公开第一方面所述的文字图像的生成方法。
[0017]本公开提供的文字图像的生成方法、装置、电子设备及存储介质，存在如下有益效果：
[0018]本公开实施例中，文字图像的生成系统获取到文字图像生成请求后，首先对生成请求中包含的源文字进行轮廓提取，获取源文字对应的轮廓图，然后确定源文字对应的扩
展文本，之后再基于扩展文本及轮廓图，生成源文字对应的文字图像。由此，通过基于源文字对应的轮廓图及扩展文本进行文字图像生成，从而既确保了生成图像的文字可读性，并且提高了生成的文字图像的内容丰富度和创意性。
[0019]应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0020]附图用于更好地理解本方案，不构成对本公开的限定。其中：
[0021]图1是根据本公开一实施例提供的一种文字图像的生成方法的流程示意图；
[0022]图2是根据本公开又一实施例提供的一种文字图像的生成方法的流程示意图；
[0023]图3是根据本公开又一实施例提供的一种文字图像的生成方法的流程示意图；
[0024]图4是根据本公开又一实施例提供的一种文字图像的生成方法的流程示意图；
[0025]图5是根据本公开又一实施例提供的一种文字图像的生成方法的流程示意图；
[0026]图6是根据本公开又一实施例提供的一种文字图像的生成方法的流程示意图；
[0027]图7是根据本公开一实施例提供的一种文字图像的生成装置的结构示意图；
[0028]图8是用来实现本公开实施例的文字图像的生成方法的电子设备的示意性框图。
具体实施方式
[0029]以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。
[0030]本公开实施例涉及人工智能
，具体涉及计算机视觉、知识图谱、深度学习

[0031]其中，人工智能(Artificial Intelligence)，英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
[0032]计算机视觉，指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。
[0033]知识图谱，是用于描述实体、概念、事物之间关系的一种结构化、语义化的表示方式，基于语义的数据结构，支持自动推理和智能查询，能够对知识进行深度挖掘和分析。
[0034]深度学习，是学习样本数据的内在规律和表示层次，这些学习过程中获得的信息对诸如文字，图像和声音等数据的解释有很大的帮助。深度学习的最终目标是让机器能够像人一样具有分析学习能力，能够识别文字、图像和声音等数据。
[0035]本公开的技术方案中，所涉及的用户个人信息的获取、存储和应用等，均符合相关法律法规的规定，且不违背公序良俗。
[0036]下面参考附图描述本公开实施例的文字图像的生成方法、装置、电子设备及存储介质。
[0037]其中，需要说明的是，本实施例的文字图像的生成方法的执行主体为文字图像的生成装置，该装置可以由软件和/或硬件的方式实现，该装置可以配置在电子设备中，电子
设备可以包括但不限于终端、服务器端等。
[0038]图1是根据本公开一实施例提供的一种文字图像的生成方法的流程示意图。
[0039]如图1所示，该文字图像的生成方法，包括：
[0040]S101：获取文字图像生成请求，其中，生成请求中包括源文字。
[0041]其中，在本公开中，文字图像可以为艺术字图像，是一种以美化文字的形式为主要目的的字体图像，可以兼具创意性和文字可读性。
[0042]其中，源文字，是指用户输入的用于生成图像的原始文字。源文字的数量可以是单个或者多个，并且源文字的形式也可以是多样的，比如，源文字可能是中文，或者也可能是英文等等，本公开对此不做限定。
[0043]本公开实施例中，用户可以在文字图像的生成系统的操作界面中，输入待生成文字图像的源文字，并点击操作界面中的图像生成控件后，文字图像的生成系统可以获取到文字图像生成请求。或者也可本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文字图像的生成方法，包括：获取文字图像生成请求，其中，所述生成请求中包括源文字；对所述源文字进行轮廓提取，获取所述源文字对应的轮廓图；确定所述源文字对应的扩展文本；基于所述扩展文本及所述轮廓图，生成所述源文字对应的文字图像。2.如权利要求1所述的方法，其中，所述对所述源文字进行轮廓提取，获取所述源文字对应的轮廓图，包括：在所述生成请求中包括所述源文字所在的第一图像的情况下，对所述第一图像中的所述源文字进行轮廓提取，获取所述源文字对应的轮廓图。3.如权利要求1所述的方法，其中，所述对所述源文字进行轮廓提取，获取所述源文字对应的轮廓图，包括：在所述生成请求中未包括所述源文字所在的第一图像的情况下，对字体库中的所述源文字对应的字体轮廓进行渲染，生成所述源文字对应的第二图像；对所述第二图像进行轮廓提取，获取所述源文字对应的轮廓图。4.如权利要求3所述的方法，其中，所述对字体库中的所述源文字对应的字体轮廓进行渲染，生成所述源文字对应的第二图像，包括：在所述生成请求中包括字体样式的情况下，基于所述字体样式对所述字体轮廓进行渲染，生成所述源文字对应的第二图像；或者，在所述生成请求中未包括字体样式的情况下，基于预设的字体样式对所述字体轮廓进行渲染，生成所述源文字对应的第二图像。5.如权利要求4所述的方法，其中，在所述基于预设的字体样式对所述字体轮廓进行渲染之前，还包括：基于待生成的目标文字图像的类型，确定所述预设的字体样式；或者，根据触发所述生成请求的服务的类型，确定所述预设的字体样式。6.如权利要求1所述的方法，其中，所述对所述源文字进行轮廓提取，获取所述源文字对应的轮廓图，包括：在所述生成请求中包含多个源文字的情况下，将所述多个源文字分别对应的轮廓进行渲染，获取渲染后的多个文字图像；基于预设的排列方式，将所述多个文字图像进行排列融合，生成第三图像；对所述第三图像进行轮廓提取，获取所述多个源文字对应的轮廓图。7.如权利要求6所述的方法，其中，在所述基于预设的排列方式，将所述多个文字轮廓进行排列融合之前，还包括：将所述生成请求中包括的排列方式，确定为所述预设的排列方式；或者，基于待生成的目标文字图像的类型，确定所述预设的排列方式。8.如权利要求1所述的方法，其中，所述确定所述源文字对应的扩展文本，包括：将从文本输入框获取的内容，确定为所述源文字对应的参考文本；基于预设的扩展文本模板，将所述参考文本进行扩展，生成所述源文字对应的扩展文本。9.如权利要求1所述的方法，其中，所述确定所述源文字对应的扩展文本，包括：
利用文本生成模型，生成所述源文字对应的扩展文本。10.如权利要求1所述的方法，其中，所述确定所述源文字对应的扩展文本，包括：基于所述源文字与各候选文字间的语义相似度，生成多个候选文本；显示所述多个候选文本；将被选中的候选文本，确定为所述源文字对应的扩展文本。11.如权利要求1所述的方法，其中，所述确定所述源文字对应的扩展文本，包括：确定所述源文字的类型；根据所述源文字的类型，确定目标文字扩展模式；基于所述目标文字扩展模式，对所述源文字进行扩展，获取所述源文字对应的扩展文本。12.如权利要求1
‑
11任一所述的方法，其中，所述基于所述扩展文本及所述轮廓图，生成所述源文字对应的文字图像，包括：利用第一编码器，将所述扩展文本进行编码处理，获取所述扩展文本对应的第一特征；利用第二编码器，将所述轮廓图进行编码处理，获取所述轮廓图对应的第二特征；将所述第一特征及所述第二特征进行融合，获取融合特征；利用解码器将所述融合特征进行解码处理，获取所述源文字对应的文字图像。13.如权利要求12所述的方法，其中，所述将所述第一特征及所述第二特征进行融合，获取融合特征，包括：基于预设的权重值，将所述第一特征及所述第二特征进行加权融合，获取融合特征。14.如权利要求13所述的方法，其中，在所述基于预设的权重值，将所述第一特征及所述第二特征进行加权融合，获取融合特征之前，还包括：基于待生成的目标文字图像的类型，确定所述预设的权重值；或者，根据触发所述生成请求的服务的类型，确定所述预设的权重值；或者，将所述生成请求中包含的权重值，确定为所述预设的权重值。15.如权利要求13所述的方法，其中，在所述获取所述源文字对应的文字图像之后，还包括：显示所述文字图像；在接收到针对所述文字图像的编辑指令的情况下，显示权重值调整控件；基于接收到的调整后的权重值，将所述第一特征及所述第二特征重新进行加权融合，基于新融合特征获取所述源文字对应的新的文字图像。16.如权利要求12所述的方法，其中，在所述基于所述扩展文本及所述轮廓图，生成所述源文字对应的文字图像之前，还包括：基于第一训练数据集，训练并获取所述第一编码器及所述解码器，其中，所述第一训练数据集中包括文本及文字图像对；基于第二训练数据集、所述第一编码器及所述解码器，训练并获取所述第二编码器，其中，每个所述第二训练数据中包括文本、文字轮廓图及对应的文字图像。17.一种文字图像的生成装置，包括：第一获取模块，用于获取文字图像生成请求，其中，所述生成请求中包括源文字；第二...

【专利技术属性】
技术研发人员：李国豪，李伟，刘家辰，肖欣延，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人