当前位置: 首页 > 专利查询>东南大学专利>正文

一种可控情感与风格的古诗生成方法技术

技术编号:27129171 阅读:17 留言:0更新日期:2021-01-25 19:55
本发明专利技术提出一种可控情感与风格的古诗生成方法,其由古诗分类、古诗生成、古诗评分与交互三个模块组成。本发明专利技术首先对语料库古诗依据风格、情感、主关键词细粒度分类,随后根据用户给定的格式、风格、情感和输入文本确定对应标签,自动生成风格可控、情感可控的押韵诗句,同时能与用户进行交互实现修改与润色,采用了编码器预训练模型和带掩膜的自注意力机制保证了生成诗句与多标签之间的自动关联。自动评测与人工评测均表明,本发明专利技术能生成情感与风格均可控的诗歌,且诗歌质量超过评测基线水平。且诗歌质量超过评测基线水平。且诗歌质量超过评测基线水平。

【技术实现步骤摘要】
一种可控情感与风格的古诗生成方法


[0001]本专利技术属于人工智能
,涉及古诗文本生成技术,特别涉及一种可控情感与风格的古诗生成技术。

技术介绍

[0002]古诗生成系统旨在根据用户需求,生成用户满意的押韵诗歌,这首先需要写诗系统要能根据用户提供的文本信息分析、抽取、概括出适合古诗的关键词,通过关键词与用户的其他需求进行古诗生成与校正。在古诗生成之后,写诗系统还要能进行自动评分与交互,继续修改与润色生成的古诗。
[0003]目前,古诗生成领域已有许多可以生成押韵且满足用户需求诗歌的模型,但这些模型都仅仅只能根据单个关键词生成诗句,导致生成的古诗通常前言不搭后语,语意连贯度不高。并且这些模型没有同时考虑到风格、情感对于古诗的影响,因此,这些模型生成的诗句缺乏多样性,且大多数是和用户意图不匹配的。能根据用户给定的多个关键词、情感、风格自动生成押韵古诗的系统,具有很高的应用价值且可以更好地实现生成古诗的适配性与多样性。

技术实现思路

[0004]为解决上述问题,本专利技术根据解码器预训练模型和带掩膜的自注意力机制,提出了一种可控情感与风格的古诗生成方法。本方法首先利用人工本方法人工检索与机器自动计算相似度相结合的方法,对训练古诗语料库按情感标签、风格标签、主关键词标签细粒度分类,预处理后利用解码器模型进行预训练。本方法其次可以根据用户的文本信息筛选、校正、分配出主关键词标签与副关键词标签,并将前者与给定的格式标签、风格标签、情感标签进行组合形成标签集,与副关键词标签共同作用实现古诗生成。本方法最后还支持用户对生成古诗进行评分与交互,实现修改与润色的功能。本方法生成的押韵古诗可以同时满足风格、情感的限制且具有更多的关键词标签,更好地理解了用户需求,同时也进一步增强了古诗的多样性,本专利技术提供了一种可控情感与风格的古诗生成方法,包括如下模块:
[0005]1)古诗分类:对收集的海量古诗依据风格标签、情感标签、主关键词标签进行分类,根据预先人工精确分类的有标签古诗,采用诗词向量的余弦距离判断相似度的方法对无标签古诗进行风格、情感分类,采用检索同义词的方法对对无标签古诗进行主关键词分类,
[0006]将每首语料库古诗预处理成统一格式,输入解码器模型进行预训练;
[0007]2)古诗生成:采用带掩膜的自注意力机制屏蔽到后续信息,增强对标签的关注并实现古诗生成,首先对输入的文本进行关键词筛选、关键词校正和关键词分配,将文本分词后筛选出概括性关键词,并根据古诗语料进行校正,分配出主关键词标签与副关键词标签,之后,将用户给定的格式标签、风格标签、情感标签和主关键词标签包装成标签集,解码器预训练模型再根据模块1)分类的训练语料库、标签集与副关键词标签自动生成关联诗句,
且进行格式和韵律的检查;
[0008]3)古诗评分和交互:本方法对传统文本生成的评价指标进行微调,令其适用于古诗生成评价,并将训练语料中的名诗名篇标记为优秀集,对模块2)生成的古诗质量进行自动评分,同时也支持人工对其情感标签、风格标签的契合度进行评分;用户还可以对生成诗歌不满意的位置进行修改与润色,并且本方法会对指定修改位置提供替换词,以达到人机交互、共同润色的作用。
[0009]作为本专利技术进一步改进,步骤1)中对收集的海量古诗依据风格标签、情感标签、主关键词标签进行分类,采用人工检索与机器自动计算相似度相结合的方法,构建按情感标签、风格标签、主关键词标签细粒度分类的训练古诗语料库和由名诗名篇组成的优秀集,本方法能依据前者进行自关联训练,依据后者和微调后的评价指标进行自动评分。
[0010]作为本专利技术进一步改进,步骤2)中对输入预处理增设关键词分配环节,根据筛选、校正后的概括性关键词和预先设置的标准主关键词来确定唯一的主关键词标签,其余均作为副关键词标签,以此达到多个关键词标签同时限制生成古诗的效果。
[0011]作为本专利技术进一步改进,步骤2)中依据用户给定的格式标签、情感标签、风格标签和主关键词标签包装成标签集,自动生成古诗,并在生成诗句时自动关联副关键词标签,以此达到情感、风格、多关键词可控的效果,最后本方法还对古诗进行筛选,剔除不满足格式、押韵需求的古诗。
[0012]与现有技术相比,本专利技术具有如下优点和有益效果:
[0013]本方法采用诗词向量的余弦距离的方法半监督地进行风格、情感分类,利用检索同义词的方法进行主关键词分类,构建了细粒度分类的训练古诗语料库。本专利技术能有效地将用户的文本需求通过关键词筛选、关键词校正和关键词分配形成概括性的主关键词标签与副关键词标签,通过多个关键词可以更好地表达用户需求。本专利技术还添加了用户给定的风格标签与情感标签,与传统的写诗系统相比,本方法可以生成风格多元、情感多元的诗歌,在加强古诗多元性的同时也能更加贴合用户需求。本方法还提出了一种适用于古诗生成的评价指标,能够实现机器自动评分,并能与用户进行交互实现指定位置的修改与润色,达到人机交互、共同润色的效果。现有的大多数模型缺乏语意连贯度与丰富度,而本方法因为考虑到了多个关键词和诗歌整体的情感、风格,所以生成的古诗具有更好的连贯度与丰富度,可以更好地满足用户需求。
附图说明
[0014]图1为本专利技术提供的可控情感与风格的古诗生成方法的逻辑流程图。
[0015]图2为古诗生成模块中关键词预处理的逻辑流程图。
[0016]图3为古诗生成模块中生成古诗的逻辑流程图。
[0017]图4为古诗分类模块的示例。
[0018]图5为由给定文本信息生成古诗的示例。
具体实施方式
[0019]下面结合附图与具体实施方式对本专利技术作进一步详细描述:
[0020]本专利技术提供一种可控情感与风格的古诗生成方法。本方法生成的押韵古诗可以同
时满足风格、情感的限制且具有更多的关键词标签,更好地理解了用户需求,同时也进一步增强了古诗的多样性。
[0021]本专利技术提供的可控情感与风格的古诗生成方法,其中逻辑流程图如图1所示,古诗生成模块中关键词预处理的逻辑流程图如图2所示,古诗生成模块中生成古诗的逻辑流程图如图3所示,古诗分类模块的示例如图4所示,具体包括如下模块:
[0022]1)古诗分类:对收集的海量古诗依据风格标签、情感标签、主关键词标签进行分类,将每首语料库古诗预处理成统一格式,输入解码器模型进行预训练。包括以下环节:
[0023]a)风格情感分类,本方法首先根据收集的海量古诗,人为确定若干个标准风格标签与标准情感风格,并筛选出有标签的古诗作为参照。其次,采用诗词向量的余弦距离度量,因为诗词向量糅合了整句诗歌的词,忽略了字词具体意义而具有整体性,可以用来判断风格与情感。通过分类,每首古诗语料会具有唯一的风格标签与情感标签,同时本方法也支持人为对其中不符合分类目标的古诗语料进行再分类。
[0024]b)主关键词分类,与环节a)类似,根据收集的海量古诗,人为确定若干个标准主关键词标签,例如“春”、“秋”、“酒”、“月”等,通过人工检索同义词的方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种可控情感与风格的古诗生成方法,包括如下模块,其特征在于:1)古诗分类:对收集的海量古诗依据风格标签、情感标签、主关键词标签进行分类,根据预先人工精确分类的有标签古诗,采用诗词向量的余弦距离判断相似度的方法对无标签古诗进行风格、情感分类,采用检索同义词的方法对无标签古诗进行主关键词分类,将每首语料库古诗预处理成统一格式,输入解码器模型进行预训练;2)古诗生成:采用带掩膜的自注意力机制屏蔽到后续信息,增强对标签的关注并实现古诗生成,首先对输入的文本进行关键词筛选、关键词校正和关键词分配,将文本分词后筛选出概括性关键词,并根据古诗语料进行校正,分配出主关键词标签与副关键词标签,之后,将用户给定的格式标签、风格标签、情感标签和主关键词标签包装成标签集,解码器预训练模型再根据模块1)分类的训练语料库、标签集与副关键词标签自动生成关联诗句,且进行格式和韵律的检查;3)古诗评分和交互:本方法对传统文本生成的评价指标进行微调,令其适用于古诗生成评价,并将训练语料中的名诗名篇标记为优秀集,对模块2)生成的古诗质量进行自动评分,同时也支持人工对其情感标...

【专利技术属性】
技术研发人员:邵一展汪鹏邵彤高捷
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1