诗词的生成方法、装置、设备及存储介质制造方法及图纸

技术编号:37971226 阅读:17 留言:0更新日期:2023-06-30 09:46
本申请提供一种诗词的生成方法、装置、设备及存储介质,涉及数据处理技术领域。该方法包括:对用户输入的至少一种类型的数据进行特征提取,分别确定各所述至少一种类型的数据对应的第一离散向量特征;采用预设的诗词生成模型根据所述第一离散向量特征、已生成诗词的第二离散向量特征和预设对齐语料库,生成诗词段落;确定当前生成的所有诗词段落是否达到预设诗词类型对应的段落要求;若是,则根据所述所有诗词段落生成目标诗词。相对于现有技术,避免了用户参与度不高的问题。免了用户参与度不高的问题。免了用户参与度不高的问题。

【技术实现步骤摘要】
诗词的生成方法、装置、设备及存储介质


[0001]本申请涉及数据处理
,具体而言,涉及一种诗词的生成方法、装置、设备及存储介质。

技术介绍

[0002]诗歌是在所有文学体裁中最常见的一种,诗歌包括了唐诗、宋词、元曲等一系列用简短的语言来抒发情感的一种文体。诗歌的诗词生成是研究计算机自动分析、理解和使用人类语言的一个重要切入点。
[0003]现有技术中一般使用诗词生成系统旨在根据用户输入信息生成相应的诗词,这需要系统从输入信息中提取和总结关键信息或特征,输入诗词生成模型中指导诗词生成。随着深度学习发展,基干循环神经网络及其变体的诗词生成模型被广泛使用。近年来,基于语言模型的诗词生成模型基本实现了在用户给定文本的前提下生成较高质量诗歌的功能。
[0004]但是这样的生成方式由于输入信息较为单一,并且时直接根据用户输入的信息生成整首诗词,导致用户参与度不高的问题。

技术实现思路

[0005]本申请的目的在于,针对上述现有技术中的不足,提供一种诗词的生成方法、装置、设备及存储介质,以解决现有技术中用户参与度不高的问本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种诗词的生成方法,其特征在于,所述方法包括:对用户输入的至少一种类型的数据进行特征提取,分别确定各所述至少一种类型的数据对应的第一离散向量特征;采用预设的诗词生成模型根据所述第一离散向量特征、已生成诗词的第二离散向量特征和预设对齐语料库,生成诗词段落;确定当前生成的所有诗词段落是否达到预设诗词类型对应的段落要求;若是,则根据所述所有诗词段落生成目标诗词。2.如权利要求1所述的方法,其特征在于,所述采用预设的诗词生成模型根据所述第一离散向量特征、已生成诗词的第二离散向量特征和预设对齐语料库,生成诗词段落之前,所述方法还包括:对所述已生成诗词进行特征提取,确定所述已生成诗词对应的第二离散向量特征。3.如权利要求1所述的方法,其特征在于,所述对用户输入的至少一种类型的数据进行特征提取,分别确定各所述至少一种类型的数据对应的第一离散向量特征之前,所述方法包括:对诗词样本集中的每个诗词样本进行分段处理,并生成所述每个诗词样本对应的分段处理后的对齐数据;其中,所述对齐数据中包括:多个诗词样本子段落、所述多个诗词样本子段落之间的上下文关系信息和所述多个诗词样本子段落对应的长度信息;将所述对齐数据加入至所述预设对齐语料库中。4.如权利要求3所述的方法,其特征在于,所述对诗词样本集中的每个诗词样本进行分段处理,并生成所述每个诗词样本对应的分段处理后的对齐数据之前,所述方法还包括:对所述诗词样本集进行数据过滤,获取过滤后的诗词样本集。5.如权利要求1所述的方法,其特征在于,所述对用户输入的至少一种类型的数据进行特征提取,分别确定各所述至少一种类型的数据对应的第一离散向量特征,包括:若所述至少一种类型的数据中包括文本数据,则对所述文本数据进行关键词抽取,确定抽取的关键词为所述文本数据对应的第一离散向量特征。6.如权利要求1所述的方法,其特征在于,所述对用户输入的至少一种类型的数据进行特征提取,分别确定各所述至少一种类型的数据对应的第一离散向量特征,包括:若所述至少一种类型的数据中包括非文本数据,则对所述非文本数据进行转文字处理,获取所述非文本数据对应的文字描述;对所述文字描述进行关键词抽取,确定抽取的关键词为所述非文本数据对应的第一离散向量特征。7.如权利要求1所述的方法,其特征在于,所述采用预设的...

【专利技术属性】
技术研发人员:常永炷张荣升吕唐杰范长杰
申请(专利权)人:网易杭州网络有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1