文本生成方法以及装置制造方法及图纸

技术编号:36867884 阅读:6 留言:0更新日期:2023-03-15 19:23
本说明书实施例提供文本生成方法以及装置,其中所述文本生成方法包括:获取对象属性信息和目标风格信息,根据各属性词,生成各属性词之间的排列顺序,根据各属性词及目标风格信息,计算各属性词的目标词向量,根据各属性词的目标词向量,预测各属性词的上下文,按照排列顺序,对各属性词和上下文进行排列,生成具有目标风格的对象描述文本。根据各属性词的排列顺序对各属性词和上下文进行排列,保证了生成的对象描述文本的语义一致性,提升了生成的对象描述文本的文本流畅度和准确性,根据目标词向量预测各属性词的上下文,使得各属性词的上下文可以体现出目标风格的风格特征,增强了对象描述文本的适用性。了对象描述文本的适用性。了对象描述文本的适用性。

【技术实现步骤摘要】
文本生成方法以及装置


[0001]本说明书实施例涉及自然语言处理
,特别涉及一种文本生成方法。

技术介绍

[0002]随着互联网技术的发展,越来越多针对项目场景中需要利用对象描述文本,例如,用于商品销售的商品介绍文章。随着项目场景的多样化、商品数量众多且商品的更新速度快,仅仅通过人工撰写是难以满足其对数量和即时性的要求。
[0003]目前,利用自然语言处理技术,学习已有人工撰写的对象描述文本的语义特征,高效地生成在文本流畅度、准确性上都符合条件的对象描述文本。
[0004]然而,这样生成的对象描述文本由于其过多关注于语义层面,而忽视了不同的应用场景中需要不同风格的对象描述文本,例如,当项目场景为直播销售时,口语化风格的商品介绍文章更能增强观众的代入感,当项目场景为电商平台的页面展示时,书面化风格的商品介绍文章更能体现平台和商家的专业度。如何高效地生成适用性更高且流畅又准确的对象描述文本是一个亟需解决的问题,本说明书提供了一种文本生成方法。

技术实现思路

[0005]有鉴于此,本说明书实施例提供了一种文本生成方法。本说明书一个或者多个实施例同时涉及一种文本生成装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
[0006]根据本说明书实施例的第一方面,提供了一种文本生成方法,包括:
[0007]获取对象属性信息和目标风格信息,其中,对象属性信息包括至少一个属性词;
[0008]根据各属性词,生成各属性词之间的排列顺序;
[0009]根据各属性词及目标风格信息,计算各属性词的目标词向量,其中,目标词向量融合了目标风格信息的风格特征;
[0010]根据各属性词的目标词向量,预测各属性词的上下文;
[0011]按照排列顺序,对各属性词和上下文进行排列,生成具有目标风格的对象描述文本。
[0012]根据本说明书实施例的第二方面,提供了一种文本生成装置,包括:
[0013]获取模块,被配置为获取对象属性信息和目标风格信息,其中,对象属性信息包括至少一个属性词;
[0014]排列顺序生成模块,被配置为根据各属性词,生成各属性词之间的排列顺序;
[0015]计算模块,被配置为根据各属性词及目标风格信息,计算各属性词的目标词向量,其中,目标词向量融合了目标风格信息的风格特征;
[0016]预测模块,被配置为根据各属性词的目标词向量,预测各属性词的上下文;
[0017]生成模块,被配置为按照排列顺序,对各属性词和上下文进行排列,生成具有目标风格的对象描述文本。
[0018]根据本说明书实施例的第三方面,提供了一种计算设备,包括:
[0019]存储器和处理器;
[0020]存储器用于存储计算机可执行指令,处理器用于执行计算机可执行指令,该计算机可执行指令被处理器执行时实现上述文本生成方法的步骤。
[0021]根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述文本生成方法的步骤。
[0022]根据本说明书实施例的第五方面,提供了一种计算机程序,其中,当计算机程序在计算机中执行时,令计算机执行上述文本生成方法的步骤。
[0023]本说明书一个或多个实施例中,获取对象属性信息和目标风格信息,其中,对象属性信息包括至少一个属性词,根据各属性词,生成各属性词之间的排列顺序,根据各属性词及目标风格信息,计算各属性词的目标词向量,其中,目标词向量融合了目标风格信息的风格特征,根据各属性词的目标词向量,预测各属性词的上下文,按照排列顺序,对各属性词和上下文进行排列,生成具有目标风格的对象描述文本。根据各属性词的排列顺序对各属性词和上下文进行排列,保证了生成的文本和属性词之间的对应关系,保证了生成的对象描述文本的语义一致性,提升了生成的对象描述文本的文本流畅度和准确性,根据各属性词及目标风格信息,计算目标词向量,再进一步根据目标词向量预测各属性词的上下文,使得各属性词的上下文可以体现出目标风格的风格特征,增强了对象描述文本的适用性。
附图说明
[0024]图1A是本说明书一个实施例提供的一种文本生成系统的结构示意图;
[0025]图1B是本说明书一个实施例提供的一种文本生成系统的文本生成指令发送界面的显示示意图;
[0026]图1C是本说明书一个实施例提供的一种文本生成系统的对象描述文本显示界面的显示示意图;
[0027]图2是本说明书一个实施例提供的一种文本生成方法的流程图;
[0028]图3是本说明书一个实施例提供的一种应用于商品摘要文本的文本生成方法的处理过程流程图;
[0029]图4是本说明书一个实施例提供的一种应用于商品摘要文本的文本生成方法的数据流向示意图;
[0030]图5是本说明书一个实施例提供的一种文本生成装置的结构示意图;
[0031]图6是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
[0032]在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
[0033]在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、
“”
和“该”也旨在包括多数形式,除非上下文清楚地表示
其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0034]应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
[0035]首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
[0036]风格:自然语言文本中词语和句子的内容形式特征。
[0037]语义:自然语言文本中对现实世界中的事物概念和概念间关系表述的特征。
[0038]图神经网络模型(GNN,Graphic Neural Network):一种利用深度学习直接对图结构数据进行学习的神经网络模型。可以实现节点分类、边数据输出和图聚类等。
[0039]Transformer模型:一种基于注意力机制的神经网络模型,通过注意力机制可以提取、分析自然语言文本的语义特征,生成目标文本。Tr本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本生成方法,包括:获取对象属性信息和目标风格信息,其中,所述对象属性信息包括至少一个属性词;根据各所述属性词,生成各所述属性词之间的排列顺序;根据各所述属性词及所述目标风格信息,计算各所述属性词的目标词向量,其中,所述目标词向量融合了所述目标风格信息的风格特征;根据各所述属性词的目标词向量,预测各所述属性词的上下文;按照所述排列顺序,对各所述属性词和上下文进行排列,生成具有目标风格的对象描述文本。2.根据权利要求1所述的方法,所述根据各所述属性词,生成各所述属性词之间的排列顺序,包括:识别各所述属性词的属性类型;根据各所述属性词的属性类型,利用预先训练的排列顺序生成模型,生成各所述属性词之间的排列顺序。3.根据权利要求2所述的方法,在所述根据各所述属性词的属性类型,利用预先训练的排列顺序生成模型,生成各所述属性词之间的排列顺序之前,还包括:获取第一样本集,其中,所述第一样本集包括多个样本文本;提取第一样本文本中样本对象的各样本属性词,其中,所述第一样本文本为所述第一样本集中的任一样本文本;根据各所述样本属性词在所述第一样本文本中的相对位置关系,构建所述第一样本文本对应的属性词拓扑图;利用所述多个样本文本及各样本文本对应的属性词拓扑图,对预设学习模型进行训练,得到排列顺序生成模型。4.根据权利要求1所述的方法,所述根据各所述属性词及所述目标风格信息,计算各所述属性词的目标词向量,包括:对各所述属性词分别进行嵌入计算,得到各所述属性词对应的初始词向量;对所述目标风格信息进行嵌入计算,得到风格向量;将所述风格向量分别与各所述属性词对应的初始词向量进行融合,得到各所述属性词的目标词向量。5.根据权利要求1

4中任一项所述的方法,所述根据各所述属性词的目标词向量,预测各所述属性词的上下文,包括:将各所述属性词的目标词向量依次输入解码器进行上下文预测,获得各所述属性词的上下文,其中,所述解码器的训练方式,包括:获取第二样本集,其中,所述第二样本集包括多个样本文本,各样本文本携带有样本风格标签;提取第二样本文本中样本对象的各样本属性词,其中,所述第二样本文本为所述第二样本集中的任一样本文本;根据各所述样本属性词和所述样本风格标签,计算各所述样本属性词的样本目标词向量;利用解码器对各所述样本属性词的样本目标词向量进行解码,得到各所述样本属性词
的预测上下文;根据所述第二样本文本中各所述样本属性词的上下文和各所述样本属性词的预测上下文,对所述解码器进行训练。6.根据权利要求5所述的方法,所述根据各所述样本属性词和所述样本风格标签,计算各所述样本属性词的样本目标词向量,包括:对各所述样本属性词分别进行嵌入计算,得到各所述样本属性词对应的初始词向量;对各所述初始词向量进行掩码处理,得到各所述样本属性词对应的参考词向量;根据所述样本风格标签,分别对各所述参考词向量进行嵌入计算,得到各所述样本属性词对应的样本风格向量;分别将各所述样本属性词对应的样本风格向量与初始词向量进行融合,得到各所述样本...

【专利技术属性】
技术研发人员:林旭鸣井立强赵中州周伟陈海青
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1