商品描述文本生成方法、装置及存储介质制造方法及图纸

技术编号:29401129 阅读:26 留言:0更新日期:2021-07-23 22:38
本公开涉及一种商品描述文本生成方法、装置及存储介质。该方法包括:获取商品标题以及商品关键描述词;将商品标题输入文本生成模型中的编码器、关键描述词输入文本生成模型中的注意力交互模块,以得到文本生成模型输出的商品描述文本,编码器用于通过注意力机制对商品标题进行权重编码,注意力交互模块用于通过注意力对齐机制将权重编码的结果与商品关键描述词进行注意力交互对齐,文本生成模型中的解码器用于基于权重编码以及经过注意力交互对齐后的编码生成包括商品标题的商品描述文本。本公开提供的技术方案能够将关键描述词融入到商品标题中,确保了商品描述文本是在商品关键信息基础上生成的,提升了商品描述文本与商品的相关性。

【技术实现步骤摘要】
商品描述文本生成方法、装置及存储介质
本公开涉及自然语言处理
,尤其涉及一种商品描述文本生成方法、装置及存储介质。
技术介绍
目前,随着电子商务的快速发展,人们对高质量商品有越来越多的需求,而商品描述文本能够解决人们如何在海量的商品中挑选出心仪的商品的问题,但是如何生成高质量的商品描述文本就成为了一个必须要考虑的问题。手动生成商品描述文本虽然质量较高但是费时费力,自动生成商品描述文本也会存在撰写质量不高的问题。
技术实现思路
为克服相关技术中存在的问题,本公开提供一种商品描述文本生成方法、装置及存储介质。根据本公开实施例的第一方面,提供一种商品描述文本生成方法,包括:获取商品标题以及商品关键描述词;将所述商品标题输入文本生成模型中的编码器、所述关键描述词输入所述文本生成模型中的注意力交互模块;其中,所述编码器用于通过注意力机制对所述商品标题进行权重编码,所述注意力交互模块用于通过注意力对齐机制将所述权重编码的结果与所述商品关键描述词进行注意力交互对齐,所述文本生成模型中的解码器用于基于所述权重编码以及经过所述注意力交互对齐后的编码生成包括所述商品标题的商品描述文本;获取所述文本生成模型输出的商品描述文本。可选地,所述编码器具体用于将所述商品标题经过不同的权重矩阵映射成多个子维度,并在对每个所述子维度分别计算自注意力后,将多个所述自注意力的计算结果进行拼接,得到所述商品标题的权重编码结果。可选地,所述解码器包括自注意力-解码层、关键词注意力-解码层、标题编码-解码层以及神经网络前馈层,所述关键词注意力-解码层的输入包括经过所述基于所述注意力交互对齐后的编码以及所述自注意力-解码层的输出,所述标题编码-解码层的输入包括所述权重编码以及所述关键词注意力-解码层的输出,使得所述解码器能够在所述商品标题的基础上,利用所述关键词指导所述商品描述文本的生成。可选地,所述编码层以及神经网络前馈层,所述编码层、所述自注意力-解码层、所述关键词注意力-解码层以及所述标题编码-解码层均包括注意力计算层。可选地,所述注意力交互模块以及所述注意力计算层采用的计算方式为多头注意力计算。可选地,所述文本生成模型还包括与所述解码器相连的复制模块,用于比较所述解码器的解码概率结果与所述标题编码-解码层的注意力计算结果,并在确定所述编码器在任一时序输出的词的解码概率结果小于对应的注意力计算结果的情况下,则根据该注意力计算结果从商品标题内选择对应的词输出作为所述商品描述文本内的词。可选地,所述文本生成模型的训练包括:获取商品标题样本以及与所述商品标题样本对应的商品描述文本样本;通过如下方式中的至少一种构建商品关键描述词样本:将所述商品描述文本样本与预设的商品属性词库进行词匹配,得到所述商品描述文本样本中与所述商品属性词库相匹配的属性词,所述商品关键描述词样本包括所述属性词;对所述商品标题样本和所述商品描述文本样本进行公共字串提取,所述商品关键描述词样本包括提取到的公共字串词;通过命名实体识别方法识别所述商品标题中的命名实体词,所述商品关键描述词样本包括提取到的命名实体词;根据所述商品标题样本、所述商品描述文本样本、以及所述商品关键描述词样本对模型进行训练,并将训练完成的模型作为所述文本生成模型。可选地,所述模型的损失函数为如下叉熵损失函数:其中,x为所述商品标题,k为所述商品关键描述词,yt为所述模型在t时序的输出,N为输出序列长度,y1,y2,……,yt-1为所述模型在t时序以前的输出。根据本公开实施例的第二方面,提供一种商品描述文本生成装置,包括:获取模块,被配置为获取商品标题以及商品关键描述词;处理模块,被配置为将所述商品标题输入文本生成模型中的编码器、所述关键描述词输入所述文本生成模型中的注意力交互模块;其中,所述编码器用于通过注意力机制对所述商品标题进行权重编码,所述注意力交互模块用于通过注意力对齐机制将所述权重编码的结果与所述商品关键描述词进行注意力交互对齐,所述文本生成模型中的解码器用于基于所述权重编码以及经过所述注意力交互对齐后的编码生成包括所述商品标题的商品描述文本;结果获得模块,用于获取所述文本生成模型输出的商品描述文本。根据本公开实施例的第三方面,提供一种商品描述文本生成装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:获取商品标题以及商品关键描述词;将所述商品标题输入文本生成模型中的编码器、所述关键描述词输入所述文本生成模型中的注意力交互模块;其中,所述编码器用于通过注意力机制对所述商品标题进行权重编码,所述注意力交互模块用于通过注意力对齐机制将所述权重编码的结果与所述商品关键描述词进行注意力交互对齐,所述文本生成模型中的解码器用于基于所述权重编码以及经过所述注意力交互对齐后的编码生成包括所述商品标题的商品描述文本;获取所述文本生成模型输出的商品描述文本。根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现第一方面中任一项所述方法的步骤。本公开的实施例提供的技术方案可以包括以下有益效果:采用上述技术方案,首先,获取商品标题以及商品关键描述词,接着,将所述商品标题输入文本生成模型中的编码器、所述关键描述词输入所述文本生成模型中的注意力交互模块。其中,所述编码器用于通过注意力机制对所述商品标题进行权重编码,所述注意力交互模块用于通过注意力对齐机制将所述权重编码的结果与所述商品关键描述词进行注意力交互对齐,所述文本生成模型中的解码器用于基于所述权重编码以及经过所述注意力交互对齐后的编码生成包括所述商品标题的商品描述文本。如此,无需人工撰写即可自动生成商品描述文本,并且由于注意力交互模块能够将关键描述词融入到商品标题中,确保了商品描述文本是在商品关键信息基础上生成的,提升了商品描述文本与商品的相关性,进而提升了生成的商品描述文本的合理性。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。图1是根据一示例性实施例示出的一种商品描述文本生成方法的流程示意图。图2是根据一示例性实施例示出的一种编码器的结构示意图。图3是根据一示例性实施例示出的一种注意力交互模块的结构示意图。图4是根据一示例性实施例示出的一种解码器的结构示意图。图5是根据一示例性实施例示出的一种文本生成模型的结构示意图。图6是根据一示例性实施例示出的一种文本生成模型的使用过程图。图7是根据一示例性实施例示出的一种商品描述文本生成装置的框图。图8是根据一示例性实施例示出的另一本文档来自技高网...

【技术保护点】
1.一种商品描述文本生成方法,其特征在于,包括:/n获取商品标题以及商品关键描述词;/n将所述商品标题输入文本生成模型中的编码器、所述关键描述词输入所述文本生成模型中的注意力交互模块;/n其中,所述编码器用于通过注意力机制对所述商品标题进行权重编码,所述注意力交互模块用于通过注意力对齐机制将所述权重编码的结果与所述商品关键描述词进行注意力交互对齐,所述文本生成模型中的解码器用于基于所述权重编码以及经过所述注意力交互对齐后的编码生成包括所述商品标题的商品描述文本;/n获取所述文本生成模型输出的商品描述文本。/n

【技术特征摘要】
1.一种商品描述文本生成方法,其特征在于,包括:
获取商品标题以及商品关键描述词;
将所述商品标题输入文本生成模型中的编码器、所述关键描述词输入所述文本生成模型中的注意力交互模块;
其中,所述编码器用于通过注意力机制对所述商品标题进行权重编码,所述注意力交互模块用于通过注意力对齐机制将所述权重编码的结果与所述商品关键描述词进行注意力交互对齐,所述文本生成模型中的解码器用于基于所述权重编码以及经过所述注意力交互对齐后的编码生成包括所述商品标题的商品描述文本;
获取所述文本生成模型输出的商品描述文本。


2.根据权利要求1所述的方法,其特征在于,所述编码器具体用于将所述商品标题经过不同的权重矩阵映射成多个子维度,并在对每个所述子维度分别计算自注意力后,将多个所述自注意力的计算结果进行拼接,得到所述商品标题的权重编码结果。


3.根据权利要求1所述的方法,其特征在于,所述解码器包括自注意力-解码层、关键词注意力-解码层、标题编码-解码层以及神经网络前馈层,所述关键词注意力-解码层的输入包括经过所述基于所述注意力交互对齐后的编码以及所述自注意力-解码层的输出,所述标题编码-解码层的输入包括所述权重编码以及所述关键词注意力-解码层的输出,使得所述解码器能够在所述商品标题的基础上,利用所述关键词指导所述商品描述文本的生成。


4.根据权利要求3所述的方法,其特征在于,所述编码层以及神经网络前馈层,所述编码层、所述自注意力-解码层、所述关键词注意力-解码层以及所述标题编码-解码层均包括注意力计算层。


5.根据权利要求4所述的方法,其特征在于,所述注意力交互模块以及所述注意力计算层采用的计算方式为多头注意力计算。


6.根据权利要求3所述的方法,其特征在于,所述文本生成模型还包括与所述解码器相连的复制模块,用于比较所述解码器的解码概率结果与所述标题编码-解码层的注意力计算结果,并在确定所述编码器在任一时序输出的词的解码概率结果小于对应的注意力计算结果的情况下,则根据该注意力计算结果从商品标题内选择对应的词输出作为所述商品描述文本内的词。


7.根据权利要求1-5中任一项所述的方法,其特征在于,所述文本生成模型的训练包括:
获取商品标题样本以及与所述商品标题样本对应的商品描述文本样本;
通过如下方式中的至少一种构建商品关键描述词样本:
将所述商品描述文本样本与预设的商品属性词...

【专利技术属性】
技术研发人员:张芮汤胜军王鹏程彭力陈帅
申请(专利权)人:北京小米移动软件有限公司北京小米松果电子有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1