【技术实现步骤摘要】
诗词生成方法及装置、电子设备、存储介质
本公开涉及数据处理
,尤其涉及一种诗词生成方法及装置、电子设备、存储介质。
技术介绍
目前,诗词生成模型通常采用序列到序列(sequence-to-sequence,seq2seq)的结构,包括编码器(encoder)和解码器(decoder)两部分;其中,编码器的输入为诗词的几个词(如题目),解码器的输入是编码器已经编码后和向量,解码器的输出是诗词全文。在诗词生成模型的训练过程中,诗词生成模型学习到诗词题目与诗词全文的映射关系,从而结束训练;在推理计算时,诗词生成模型中编码器接受到指定的输入内容,解码器即可生成对应的诗词全文,从而完成机器创作的过程。实际应用中,对于指定位置藏字的需求,若生成藏头诗,则需要对训练数据中的每首诗词做以下处理:提取出每一句的第一个字作为编码器的输入数据,诗词全文作为解码器的输入数据;若生成藏尾诗,对于训练数据的每首诗,解码器的输入数据是诗词全文,而编码器的输入内容则改为每一句的最后一个字。比如说,训练数据中的一首诗:《 ...
【技术保护点】
1.一种诗词生成方法,其特征在于,包括:/n获取输入数据,所述输入数据包括至少一个文字以及各文字的位置;/n将所述输入数据输入到预设的诗词生成模型,由所述诗词生成模型生成包括所述至少一个文字且各文字的位置在对应位置的诗词,将所述诗词作为与所述输入数据对应的目标诗词。/n
【技术特征摘要】
1.一种诗词生成方法,其特征在于,包括:
获取输入数据,所述输入数据包括至少一个文字以及各文字的位置;
将所述输入数据输入到预设的诗词生成模型,由所述诗词生成模型生成包括所述至少一个文字且各文字的位置在对应位置的诗词,将所述诗词作为与所述输入数据对应的目标诗词。
2.根据权利要求1所述的诗词生成方法,其特征在于,所述预设的诗词生成模型包括序列到序列模型。
3.根据权利要求2所述的诗词生成方法,其特征在于,所述诗词生成模型采用以下步骤进行训练:
获取多个训练数据;各训练数据包括至少一个文字和各文字的位置,以及所述至少一个文字所在的目标诗词;所述各文字的位置是指与该文字以目标诗词中第一个文字作为起始点的序号,或者该文字在目标诗词中的行列位置;
将所述各训练数据依次输入到诗词生成模型的编码器中,由所述编码器根据所述至少一个文字和所述各文字的位置生成目标编码向量;
将所述目标编码向量和所述目标诗词输入到所述诗词生成模型的解码器中进行训练,直至训练结束。
4.根据权利要求3所述的诗词生成方法,其特征在于,根据所述至少一个文字和所述各文字的位置生成目标编码向量,包括:
根据至少一个文字获得文字编码向量,以及根据所述各文字的位置生成位置编码向量;
合成所述文字编码向量和所述位置编码向量,获得所述目标编码向量。
5.根据权利要求3所述的诗词生成方法,其特征在于,训练结束条件包括以下至少一种:
所述编码器中的损失函数的输出值小于或等于预设的损失阈值;或者,
所述编码器输出的诗词与目标诗词的相似度超过预设的相似度阈值。
6.一种诗词生成装置,其特征在于,包括:
输入数据获取模块,用于获取输入数据,所述输入数据包括至少一个文字以及各文字的位置;
目标诗词获取模块,用于将所述输入数据输入到预设的诗词生成模型,由所述诗词生成模型生成包括所述至少一个...
【专利技术属性】
技术研发人员:肖克聪,崔志,夏小强,
申请(专利权)人:北京小米松果电子有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。