【技术实现步骤摘要】
文字图像的生成方法、装置、电子设备及存储介质
[0001]本公开涉及人工智能
,尤其涉及计算机视觉、知识图谱、深度学习等
,具体涉及一种文字图像的生成方法、装置、电子设备及存储介质。
技术介绍
[0002]近年来,人工智能内容生成技术(AI
‑
Generated Content,AIGC)发展迅速,该技术能够大幅提升内容生产的质量与效率。其中,文本到图像的生成技术得到了尤其广泛的关注和应用,这项技术能够满足用户通过简单的文本描述,自动生成专业水平的精美画作的需求,在很多场合具有较高的利用价值,因此找到一种高效率、高质量的图像生成方法是目前亟待解决的问题。
技术实现思路
[0003]本公开提供了一种文字图像的生成方法、装置、电子设备及存储介质。
[0004]根据本公开的第一方面,提供了一种文字图像的生成方法,包括:
[0005]获取文字图像生成请求,其中,所述生成请求中包括源文字;
[0006]对所述源文字进行轮廓提取,获取所述源文字对应的轮廓图;
...
【技术保护点】
【技术特征摘要】
1.一种文字图像的生成方法,包括:获取文字图像生成请求,其中,所述生成请求中包括源文字;对所述源文字进行轮廓提取,获取所述源文字对应的轮廓图;确定所述源文字对应的扩展文本;基于所述扩展文本及所述轮廓图,生成所述源文字对应的文字图像。2.如权利要求1所述的方法,其中,所述对所述源文字进行轮廓提取,获取所述源文字对应的轮廓图,包括:在所述生成请求中包括所述源文字所在的第一图像的情况下,对所述第一图像中的所述源文字进行轮廓提取,获取所述源文字对应的轮廓图。3.如权利要求1所述的方法,其中,所述对所述源文字进行轮廓提取,获取所述源文字对应的轮廓图,包括:在所述生成请求中未包括所述源文字所在的第一图像的情况下,对字体库中的所述源文字对应的字体轮廓进行渲染,生成所述源文字对应的第二图像;对所述第二图像进行轮廓提取,获取所述源文字对应的轮廓图。4.如权利要求3所述的方法,其中,所述对字体库中的所述源文字对应的字体轮廓进行渲染,生成所述源文字对应的第二图像,包括:在所述生成请求中包括字体样式的情况下,基于所述字体样式对所述字体轮廓进行渲染,生成所述源文字对应的第二图像;或者,在所述生成请求中未包括字体样式的情况下,基于预设的字体样式对所述字体轮廓进行渲染,生成所述源文字对应的第二图像。5.如权利要求4所述的方法,其中,在所述基于预设的字体样式对所述字体轮廓进行渲染之前,还包括:基于待生成的目标文字图像的类型,确定所述预设的字体样式;或者,根据触发所述生成请求的服务的类型,确定所述预设的字体样式。6.如权利要求1所述的方法,其中,所述对所述源文字进行轮廓提取,获取所述源文字对应的轮廓图,包括:在所述生成请求中包含多个源文字的情况下,将所述多个源文字分别对应的轮廓进行渲染,获取渲染后的多个文字图像;基于预设的排列方式,将所述多个文字图像进行排列融合,生成第三图像;对所述第三图像进行轮廓提取,获取所述多个源文字对应的轮廓图。7.如权利要求6所述的方法,其中,在所述基于预设的排列方式,将所述多个文字轮廓进行排列融合之前,还包括:将所述生成请求中包括的排列方式,确定为所述预设的排列方式;或者,基于待生成的目标文字图像的类型,确定所述预设的排列方式。8.如权利要求1所述的方法,其中,所述确定所述源文字对应的扩展文本,包括:将从文本输入框获取的内容,确定为所述源文字对应的参考文本;基于预设的扩展文本模板,将所述参考文本进行扩展,生成所述源文字对应的扩展文本。9.如权利要求1所述的方法,其中,所述确定所述源文字对应的扩展文本,包括:
利用文本生成模型,生成所述源文字对应的扩展文本。10.如权利要求1所述的方法,其中,所述确定所述源文字对应的扩展文本,包括:基于所述源文字与各候选文字间的语义相似度,生成多个候选文本;显示所述多个候选文本;将被选中的候选文本,确定为所述源文字对应的扩展文本。11.如权利要求1所述的方法,其中,所述确定所述源文字对应的扩展文本,包括:确定所述源文字的类型;根据所述源文字的类型,确定目标文字扩展模式;基于所述目标文字扩展模式,对所述源文字进行扩展,获取所述源文字对应的扩展文本。12.如权利要求1
‑
11任一所述的方法,其中,所述基于所述扩展文本及所述轮廓图,生成所述源文字对应的文字图像,包括:利用第一编码器,将所述扩展文本进行编码处理,获取所述扩展文本对应的第一特征;利用第二编码器,将所述轮廓图进行编码处理,获取所述轮廓图对应的第二特征;将所述第一特征及所述第二特征进行融合,获取融合特征;利用解码器将所述融合特征进行解码处理,获取所述源文字对应的文字图像。13.如权利要求12所述的方法,其中,所述将所述第一特征及所述第二特征进行融合,获取融合特征,包括:基于预设的权重值,将所述第一特征及所述第二特征进行加权融合,获取融合特征。14.如权利要求13所述的方法,其中,在所述基于预设的权重值,将所述第一特征及所述第二特征进行加权融合,获取融合特征之前,还包括:基于待生成的目标文字图像的类型,确定所述预设的权重值;或者,根据触发所述生成请求的服务的类型,确定所述预设的权重值;或者,将所述生成请求中包含的权重值,确定为所述预设的权重值。15.如权利要求13所述的方法,其中,在所述获取所述源文字对应的文字图像之后,还包括:显示所述文字图像;在接收到针对所述文字图像的编辑指令的情况下,显示权重值调整控件;基于接收到的调整后的权重值,将所述第一特征及所述第二特征重新进行加权融合,基于新融合特征获取所述源文字对应的新的文字图像。16.如权利要求12所述的方法,其中,在所述基于所述扩展文本及所述轮廓图,生成所述源文字对应的文字图像之前,还包括:基于第一训练数据集,训练并获取所述第一编码器及所述解码器,其中,所述第一训练数据集中包括文本及文字图像对;基于第二训练数据集、所述第一编码器及所述解码器,训练并获取所述第二编码器,其中,每个所述第二训练数据中包括文本、文字轮廓图及对应的文字图像。17.一种文字图像的生成装置,包括:第一获取模块,用于获取文字图像生成请求,其中,所述生成请求中包括源文字;第二...
【专利技术属性】
技术研发人员:李国豪,李伟,刘家辰,肖欣延,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。