【技术实现步骤摘要】
图片生成方法、装置、计算机设备和介质
[0001]本专利技术涉及机器学习领域,更具体而言,涉及一种图片生成方法、装置、计算机设备和介质。
技术介绍
[0002]目前,有一些为用户根据用户的图片素材制作成品图片的应用、网站等,例如根据用户的物品或人像照片为用户制作海报,或根据产品照片来制作平面广告图片,以取代设计师、美工等人为工作。这些应用、网站等一般采取预先设定的一些固定范式,如“背景+物品修饰+文案修饰+文案
……”
,或套取预先设计的模板。这样,必然导致图片缺乏创意,多样性差等问题。
技术实现思路
[0003]有鉴于此,本公开提出一种图片生成技术,它能够提高图片生成的个性化程度,提高多样性,使设计更智能化。
[0004]为了达到这个目的,根据本公开的一个方面,提供了一种图片生成方法,包括:
[0005]生成第一码序列,所述第一码序列包含至少基于物品图生成的物品图层和至少基于文案生成的文案图层的图层信息;
[0006]将第一码序列输入到串联的卷积层和长短期记忆LSTM ...
【技术保护点】
【技术特征摘要】
1.一种图片生成方法,包括:生成第一码序列,所述第一码序列包含至少基于物品图生成的物品图层和至少基于文案生成的文案图层的图层信息;将第一码序列输入到串联的卷积层和长短期记忆LSTM层,输出第二码序列,所述第二码序列代表生成的图片图层信息;基于第二码序列,生成所述图片。2.根据权利要求1所述的方法,其中,所述物品图层除了基于所述物品图之外,还基于图片生成要求生成;所述文案图层除了基于所述文案之外,还基于图片生成要求生成。3.根据权利要求2所述的方法,其中,所述第一码序列包含代表所述物品图层的码串、和代表所述文案图层的码串,其中每个码串包括颜色代码、卷积神经网络CNN特征代码、主题风格代码、设计手法代码、元素种类代码、空间信息代码,分别用于表示该码串代表的图层的颜色特征、CNN特征、主题风格特征、设计手法特征、元素种类特征、空间信息特征。4.根据权利要求3所述的方法,其中,所述颜色代码通过以下方式获得:对该码串代表的图层的各像素的颜色进行聚类;将所述颜色聚成的类的标识作为所述颜色代码。5.根据权利要求4所述的方法,其中,所述对该码串代表的图层的各像素的颜色进行聚类包括:将该码串代表的图层的各像素的颜色组成颜色向量;确定该颜色向量与作为聚类中心的多个聚类基准颜色向量的距离;将距离最小的聚类基准颜色向量作为聚类结果。6.根据权利要求3所述的方法,其中,所述CNN特征代码通过以下方式获得:将该码串代表的图层输入CNN,由所述CNN输出所述CNN特征代码。7.根据权利要求3所述的方法,其中,所述主题风格代码通过以下方式获得:如所述图片生成要求中指示主题风格,将指示的主题风格转换成所述主题风格代码;如所述图片生成要求中未指示主题风格,将该码串代表的图层的各像素的颜色输入主题风格机器学习模型,由所述主题风格机器学习模型输出主题风格代码。8.根据权利要求3所述的方法,其中,所述设计手法代码通过以下方式获得:如所述图片生成要求中指示设计手法,将指示的设计手法转换成所述设计手法代码;如所述图片生成要求中未指示设计手法,将该码串代表的图层的各像素的颜色输入设计手法机器学习模型,由所述设计手法机器学习模型输出设计手法代码。9.根据权利要求3所述的方法,其中,所述元素种类代码通过以下方式获得:从该码串代表的图层中识别元素;将识别出的元素的种类转换成元素种类代码。10.根据权利要求3所述的方法,其中,所述空间信息代码通过以下方式获得:将该码串代表的图层的覆盖区域的长度和宽度分别进行m等分和n等分,将所述覆盖区域划分成m
×
n个矩形格,其中,m和n为自然数;根据图层中的图层元素所占的矩形格的标识,生成所述空间信息代码。11.根据权利要求1所述的方法,其中,在生成第一码序列后,所述方法还包括:展示所述第一码序列对应的物品图层和文案图层;
接收用户对展示的物品图层和文案图层的第一调整指示;响应于所述第一调整指示,对所述第一码序列进行调整。12.根据权利要求1所述的方法,其中,所述将第一码序列输入到串联的卷积层和长短期记忆LSTM层,包括:将所述第一码序列输入所述卷积层前加入的嵌入层,由嵌入层输出升高维度后的码序列;将升高维度后的码序列输入串联的卷积层和长短期记忆LSTM层。13.根据权利要求12所述的方法,其中,在将升高维度后的码序列输入串联的卷积层和长短期记忆LSTM层之后,所述方法还包括:将所述长短期记忆LSTM层的输出结果输入到所述长短期记忆LSTM层后面加入的全连接层,以降低维度,得到第二码序列。14.根据权利要求3所述的方法,其中,所述将第一码序列输入到串联的卷积层和长短期记忆LSTM层,输出第二码序列,包括:将所述物品图层的码串、所述文案图层的码串、和已预测出的图层的码串输入到串联的卷积层和长短期记忆LSTM层,输出下一预测图层的码串,直到所述图片全部图层的码串都预测出;将预测出的全部图层的码串连接成所述第二码序列。15.根据权利要求1所述的方法,其中,所述第二码序列包含代表生成的图片的各图层信息的码串,其中每个码串包括颜色代码、卷积神经网络CNN特征代码、主题风格代码、设计手法代码、元素种类代码、空间信息代码,分别用于表示该码串代表的图层的颜色特征、CNN特征、主题风格特征、设计手法特征、元素种类特征、空间信息特征;所述基于第二码序列,生成所述图片,包括:将代表每个图层信息的码串分别输入绘制模型,由绘制模型绘制出相应图层;将绘制模型绘制出的各图层叠加,得到所述图片。16.根据权利要求15所述的方法,其中,在将代表每个图层信息的码串分别输入绘制模型,由绘制模型绘制出相应图层后,所述方法还包括:展示绘制的各图层;接收用户对展示的各图层的第二调整指示;响应于所述第二调整指示,对相应图层进行调整。17.一种图片生成装置,包括:第一码序列生成单元,用于生成第一码序列,所述第一码序列包含至少基于物品图生成的物品图层和至少基于文案生成的文案图层的图层信息;第二码序列生成单元,用于将第一码序列输入到串联的卷积层和长短期记忆LSTM层,输出第二码序列,所述第二码序列代表生成的图片图层信息;图片生成单元,用于基于第二码序列,生成所述图片。18.根据权利要求17所述的装置,其中,所述物品图层除了基于所述物品图之外,还基于图片生成要求生成;所述文案图层除了基于所述文案之外,还基于图片生成要求生成。19.根据权利要求17所述的装置,其中,所述第一码序列包含代表所述物品图层的码串、和代表所述文案图层的码串,其中每个码串包括颜色代码、卷积神经网络CNN特征代码、
主题风格代码、设计手法代码、元素种类代码、空间信息代码,分别用于表示该码串代表的图层的颜色特征、CNN特征、主题风格特征、设计手法特征、元素种类特征、空间信息特征。20.根据权利要求19所述的装置,其中,所述颜色代码通过以下方式获得:对该码串代表的图层的各像素的颜色进行聚类;将所述颜色聚成的类的标识作为所述颜色代码。21.根据权利要求20所述的装置,其中,所述对该码串代表的图层的各像素的颜色进行聚类包括:将该码串代表的图层的各像素的颜色组成颜色向量;确定该颜色向量与作为聚类中心的多个聚类基准颜色向量的距离;将距离最小的聚类基准颜色向量作为聚类结果。22.根据权利要求19所述的装置,其中,所述CNN特征代码通过以下方式获得:将该码串代表的图层输入CNN,由所述CNN输出所述CNN特征代码。23.根据权利要求19所述的装置,其中,所述主题风格代码通过以下方式获得:如所述图片生成要求中指示主题风格,将指示的主题风格转换成所述主题风格代码;如所述图片生成要求中未指示主题风格,将该码串代表的图层的各像素的颜色输入主题风格机器学习模型,由所述主题风格机器学习模型输出主题风格代码。24.根据权利要求19所述的装置,其中,所述设计手法代码通过以下方式获得:如所述图片生成要求中指示设计手法,将指示的设计手法转换成所述设计手法代码;如所述图片生成要求中未指示设计手法,将该码串代表的图层的各像素的颜色输入设计手法机器学习模型,由所述设计手法机器学习模型输出设计手法代码。25.根据权利要求19所述的装置,其中,所述元素种类代码通过以下方式获得:从该码串代表的图层中识别元素;将识别出的元素的种类转换成元素种类代码。26.根据权利要求19所述的装置,其中,所述空间信息代码通过以下方式获得:将该码串代表的图层的覆盖区域的长度和宽度分别进行m等分和n等分,将所述覆盖区域划分成m
×
n个矩形格,其中,m和n为自然数;根据图层中的图层元素所占的矩形格的标识,生成所述空间信息代码。27.根据权利要求17所述的装置,其中,所述装置还包括:物品图层和文案图层展示单元,用于在生成第一码序列后,展示所述第一码序列对应的物品图层和文案图层;第一调整指示接收单元,用于接收用户对展示的物品图层和文案图层的第一调整指示;第一调整单元,用于响应于所述第一调整指示,对所述第一码序列进行调整。28.根据权利要求17所述的装置,其中,所述第二码序列生成单元进一步用于:将所述第一码序列输入所述卷积层前加入的嵌入层,由嵌入层输出升高维度...
【专利技术属性】
技术研发人员:崔苗苗,谢宣松,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。