文案生成方法、装置、设备和计算机可读存储介质制造方法及图纸

技术编号:25397932 阅读:31 留言:0更新日期:2020-08-25 23:02
本公开的实施例提供了文案生成方法、装置、设备和计算机可读存储介质。所述方法包括接收用户终端发送的文案生成请求,所述文案生成请求包括用户输入的视频和/或图片;对所述用户输入的视频和/或图片进行信息抽取,得到对应的嵌入向量;将所述嵌入向量输入预先训练的文案生成模型,生成文案。以此方式,可以快速、高效地生成文案,提升了文案生成的多样性和准确性,提高了文案制作效率,提升了用户获取进行产品描述的文案的整体体验。

【技术实现步骤摘要】
文案生成方法、装置、设备和计算机可读存储介质
本公开的实施例一般涉及计算机
,并且更具体地,涉及文案生成方法、装置、设备和计算机可读存储介质。
技术介绍
文案,包括标题、正文,可以用于描述营销产品。文案需要准确、简洁地向受众展示所承载的信息。由于数据巨大,人工进行文案撰写耗时耗力,影响产品描述文案的推荐体验。已有的自动文案生成的方法,难以控制文案的质量,并且无法提供多样的文案候选。
技术实现思路
根据本公开的实施例,提供了一种文案生成方案。在本公开的第一方面,提供了一种文案生成方法。该方法包括:接收用户终端发送的文案生成请求,所述文案生成请求包括用户输入的视频和/或图片;对所述用户输入的视频和/或图片进行信息抽取,得到对应的嵌入向量;将所述嵌入向量输入预先训练的文案生成模型,生成文案。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,对用户输入的视频和/或图片进行信息抽取包括:从用户输入的视频截取图片,对用户输入的视频截取到的图片和/或用户输入的图片进行信息抽取。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述进行信息抽取,得到对应的嵌入向量包括:将用户输入的视频截取到的图片和/或用户输入的图片输入预先训练的神经网络模型,得到对应的嵌入向量;其中,所述嵌入向量是对于图片信息的表示。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述预先训练的文案生成模型为Transformer结构的seq2seq模型。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述文案生成模型被设置为按照以下方式训练得到:获取多个历史文案;将历史文案,以及历史文案对应的图片作为训练样本;利用反向传播算法调整所述文案生成模型的编码器和解码器的训练参数,直到所述文案生成模型达到预设要求。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述文案生成请求还包括用户输入的关键词,所述关键词用于表示色彩、类别、物体识别、饱和度、情感度中的至少一个。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述方法还包括:生成所述关键词的词向量,将所述嵌入向量与所述词向量进行融合;将融合后的向量输入预先训练的文案生成模型,生成文案。在本公开的第二方面,提供了一种文案生成装置。该装置包括:接收模块,用于接收用户终端发送的文案生成请求,所述文案生成请求包括视频和/或图片;扩展模块,用于所述视频和/或图片进行信息抽取,得到对应的嵌入向量;文案生成模块,用于将所述嵌入向量输入预先训练的文案生成模型,生成文案。在本公开的第三方面,提供了一种电子设备。该电子设备包括:存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如以上所述的方法。在本公开的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如根据本公开的第一方面的方法。应当理解,
技术实现思路
部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。附图说明结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:图1示出了能够在其中实现本公开的实施例的示例性运行环境的示意图;图2示出了根据本公开的实施例的文案生成方法的流程图;图3示出了根据本公开的实施例的文案生成方法的流程图;图4示出了根据本公开的实施例的文案生成装置的方框图;图5示出了能够实施本公开的实施例的示例性电子设备的方框图。具体实施方式为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本公开保护的范围。另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。本公开中,通过扩展用户输入的文案生成请求包含的关键词,通过Transformer结构的seq2seq模型生成对应的文案,提高了文案生成的速度和准确性。图1示出了能够在其中实现本公开的实施例的示例性运行环境100的示意图。如图1所示,系统架构100可以包括终端设备102、网络104和服务器106。网络104用以在终端设备102和服务器106之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。终端设备102可以是具有显示屏的各种电子设备,包括但不限于台式计算机、便携式计算机、智能手机和平板电脑等等。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器106可以是多个服务器组成的服务器集群或云服务器等。本公开实施例所提供的文案生成方法一般由服务器106执行,相应地,目标文案生成装置一般设置于服务器106中。但本领域技术人员容易理解的是,本公开实施例所提供的文案生成方法也可以由终端设备102执行,相应的,文案生成装置也可以设置于终端设备102中,本示例性实施例中对此不做特殊限定。举例而言,在一种示例性实施例中,可以是用户通过终端设备102将视频和/或图片上传至服务器106,服务器106通过本公开实施例所提供的文案生成方法生成对应的文案,将所生成的文案传输给终端设备102等。应该理解的是,图1所示的应用场景仅是本专利技术的实施例可以在其中得以实现的一个示例。本专利技术实施例的适用范围不受到该应用场景任何方面的限制。图2示出了根据本公开实施例的文案生成方法200的流程图。方法200可以由图1中的终端设备102执行。在框210,接收用户终端发送的文案生成请求,所述文案生成请求包括用户输入的视频和/或图片;在一些实施例中,所述文案生成请求包括目标物品对应的视频和/或图片,例如,拍摄的连衣裙的视频和/或拍摄的连衣裙的图片。其中,所述图片可以为一种或多张。在一些实施例中,目标物品可以是指需要对目标对象进行展示或者介绍的物品,例如,目标物品可以是用作交易的商品,也可以是最新生产的产品,当然,目标物品还可以是可交易的虚拟物品,本公开实施例对此不做特殊限定。在框220,对所述用户输入的视频和/或图片进行信息抽取,得到对应的嵌入向量;在一些实施例中,通过预先训练的神经网络模型进行信息抽取,所述神经网络模型的输入为图片,因此,需要从用户输入的视频截取图片,对用户输入的视频截取到的图片和/或用户本文档来自技高网
...

【技术保护点】
1.一种文案生成方法,其特征在于,包括:/n接收用户终端发送的文案生成请求,所述文案生成请求包括用户输入的视频和/或图片;/n对所述用户输入的视频和/或图片进行信息抽取,得到对应的嵌入向量;/n将所述嵌入向量输入预先训练的文案生成模型,生成文案。/n

【技术特征摘要】
1.一种文案生成方法,其特征在于,包括:
接收用户终端发送的文案生成请求,所述文案生成请求包括用户输入的视频和/或图片;
对所述用户输入的视频和/或图片进行信息抽取,得到对应的嵌入向量;
将所述嵌入向量输入预先训练的文案生成模型,生成文案。


2.根据权利要求1所述的方法,其特征在于,对用户输入的视频和/或图片进行信息抽取包括:
从用户输入的视频截取图片,对用户输入的视频截取到的图片和/或用户输入的图片进行信息抽取。


3.根据权利要求2所述的方法,其特征在于,所述进行信息抽取,得到对应的嵌入向量包括:
将用户输入的视频截取到的图片和/或用户输入的图片输入预先训练的神经网络模型,得到对应的嵌入向量;其中,
所述嵌入向量是对于图片信息的表示。


4.根据权利要求1所述的方法,其特征在于,
所述预先训练的文案生成模型为Transformer结构的seq2seq模型。


5.根据权利要求3所述的方法,其特征在于,所述文案生成模型被设置为按照以下方式训练得到:
获取多个历史文案;将历史文案,以及历史文案对应的图片作为训练样本;
利用反向传播算法调整所述文案生成模...

【专利技术属性】
技术研发人员:周旻平
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1