一种自动生成情感文本的方法及终端技术

技术编号:34852632 阅读:24 留言:0更新日期:2022-09-08 07:53
本发明专利技术提供了一种自动生成情感文本的方法及终端,获取待处理文章和不同情感倾向类别对应的社交短文本模板;根据所述待处理文章得到主题关键词;根据所述主题关键词填充所述社交短文本模板,得到情感文本并输出;本发明专利技术将通过待处理文章得到的主题关键词填充到社交短文本模板中,实现自动生成的情感文本与具体的文章主题相关联,更加贴合人在阅读文章或段落后观点的自然表达习惯,从而实现了高质量的情感文本生成。为构建仿真社交网络提供了高质量的素材资源,也为其他模型的训练提供了数据上的补充。上的补充。上的补充。

【技术实现步骤摘要】
一种自动生成情感文本的方法及终端


[0001]本专利技术涉及自然语言处理领域,尤其涉及一种自动生成情感文本的方法及终端。

技术介绍

[0002]现有技术对文本生成方法主要采用深度学习方法,涉及整理海量且质优的训练数据集进行训练,通过模型输入到输出直接生成最终文本的方式。其中,对训练集的数据要求很高,具体表现为两个难点,第一是源数据必须保证输入输出部分,在内容上保持强联系并输出倾向;其次海量的训练数据标记需要大量的人工成本。因此考虑到人力物力的投入成本,很难制作一个优质的训练数据集,当数据集质量不能得到保证的情况下,现存在的很多训练好的模型生成的文本就表现为质量较低,与文章或话题主题并无强联系,不能起到很好的效果,并且低质量言论信息或明显的机器生成文本内容也很难通过所发布的社交平台的检测机制,不能在没有人工干预的情况下直接作为实际应用。

技术实现思路

[0003]本专利技术所要解决的技术问题是:提供一种自动生成情感文本的方法及终端,实现高质量文本语料的生成。
[0004]为了解决上述技术问题,本专利技术采用的一种技术方案为:
[0005]一种自动生成情感文本的方法,包括步骤:
[0006]获取待处理文章和不同情感倾向类别对应的社交短文本模板;
[0007]根据所述待处理文章得到主题关键词;
[0008]根据所述主题关键词填充所述社交短文本模板,得到情感文本并输出。
[0009]为了解决上述技术问题,本专利技术采用的另一种技术方案为:
[0010]一种自动生成情感文本的终端,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0011]获取待处理文章和不同情感倾向类别对应的社交短文本模板;
[0012]根据所述待处理文章得到主题关键词;
[0013]根据所述主题关键词填充所述社交短文本模板,得到情感文本并输出。
[0014]本专利技术的有益效果在于:获取一篇待处理文章,根据不同情感倾向类别训练不同的社交短文本模板,将通过待处理文章得到的主题关键词填充到社交短文本模板中,实现自动生成的情感文本与具体的文章主题相关联,更加贴合人在阅读文章或段落后观点的自然表达习惯,从而实现了高质量的情感文本生成。为构建仿真社交网络提供了高质量的素材资源,也为其他模型的训练提供了数据上的补充。
附图说明
[0015]图1为本专利技术实施例的一种自动生成情感文本的方法的步骤流程图;
[0016]图2为本专利技术实施例的一种自动生成情感文本的终端的结构示意图;
[0017]图3为本专利技术实施例的一种自动生成情感文本的另一方法的步骤流程图;
[0018]图4为本专利技术实施例的seq2seq提取文章摘要过程示意图;
[0019]图5为本专利技术实施例的社交短文本模板生成过程示意图。
[0020]标号说明:
[0021]1、一种自动生成情感文本的终端;2、处理器;3、存储器。
具体实施方式
[0022]为详细说明本专利技术的
技术实现思路
、所实现目的及效果,以下结合实施方式并配合附图予以说明。
[0023]请参照图1,一种自动生成情感文本的方法,包括步骤:
[0024]获取待处理文章和不同情感倾向类别对应的社交短文本模板;
[0025]根据所述待处理文章得到主题关键词;
[0026]根据所述主题关键词填充所述社交短文本模板,得到情感文本并输出。
[0027]从上述描述可知,本专利技术的有益效果在于:获取一篇待处理文章,根据不同情感倾向类别训练不同的社交短文本模板,将通过待处理文章得到的主题关键词填充到社交短文本模板中,实现自动生成的情感文本与具体的文章主题相关联,更加贴合人在阅读文章或段落后观点的自然表达习惯,从而实现了高质量的情感文本生成。为构建仿真社交网络提供了高质量的素材资源,也为其他模型的训练提供了数据上的补充。
[0028]进一步地,所述根据所述待处理文章得到主题关键词包括:
[0029]将所述待处理文章输入长短期记忆网络模型,得到关键词向量和语义向量;
[0030]将所述关键词向量和所述语义向量做注意力操作,得到主题关键词向量;
[0031]根据所述主题关键词向量得到主题关键词。
[0032]由上述描述可知,将待处理文章通过长短期记忆网络模型(LSTM)得到关键词向量和语义向量,最终得到主题关键词,实现对待处理文章主题的提炼。
[0033]进一步地,所述获取待处理文章和不同情感倾向类别对应的预设社交短文本模板之前包括:
[0034]获取训练评论;
[0035]根据TF

IDF词频统计方法计算出所述训练评论中每一训练评论对应的高频词集合;
[0036]根据所述高频词集合及情感敏感表得到所述每一训练评论对应的情感倾向类别;
[0037]根据所述情感倾向类别对应的所述训练评论得到所述情感倾向类别对应的社交短文本模板。
[0038]由上述描述可知,获取训练评论,训练评论可选择符合表达主观情感倾向的文本,再根据不同情感倾向类别训练对应的社交短文本模板,保证最终生成的情感文本更加贴合自然语言。
[0039]进一步地,所述根据所述情感倾向类别对应的所述训练评论得到所述情感倾向类别对应的社交短文本模板包括:
[0040]去除所述情感倾向类别对应的所述训练评论中的主题词、前缀及后缀,并保留主题词空缺得到所述社交短文本模板。
[0041]由上述描述可知,将训练评论中原有的主题词、前缀及后缀删除,保留表达出情感倾向的主干部分,方便后续填充内容实现对不同主题的情感表达,并且能够最大程度保留自然语言中的语言习惯,贴合人发出的文本。
[0042]进一步地,所述据所述主题关键词填充所述社交短文本模板,得到情感文本并输出包括:
[0043]根据所述主题关键词填充所述社交短文本模板中的主题词空缺,得到情感文本并输出。
[0044]由上述描述可知,将根据待处理文章得到的主题关键词填入社交短文本模板中的主题词空缺,则生成了对应待处理文章的情感文本,实现自动生成针对性的观点表达。
[0045]进一步地,所述根据所述待处理文章得到主题关键词还包括:
[0046]根据所述待处理文章得到文章摘要;
[0047]所述根据所述主题关键词填充所述社交短文本模板,得到情感文本并输出具体为:
[0048]根据所述主题关键词填充所述社交短文本模板,并和所述文章摘要进行聚合,得到情感文本并输出。
[0049]由上述描述可知,还根据待处理文章得到文章摘要,并将文章摘要与填充后的社交短文本模板进行聚合得到情感文本,贴合人在对事物表达情感时进行对应总结的习惯,进一步最终生成的情感文本的质量。
[0050]进一步地,所述根据所述待处理文章得到文章摘要包括:
[0051]将所述待处理文章通过s本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自动生成情感文本的方法,其特征在于,包括步骤:获取待处理文章和不同情感倾向类别对应的社交短文本模板;根据所述待处理文章得到主题关键词;根据所述主题关键词填充所述社交短文本模板,得到情感文本并输出。2.根据权利要求1所述的一种自动生成情感文本的方法,其特征在于,所述根据所述待处理文章得到主题关键词包括:将所述待处理文章输入长短期记忆网络模型,得到关键词向量和语义向量;将所述关键词向量和所述语义向量做注意力操作,得到主题关键词向量;根据所述主题关键词向量得到主题关键词。3.根据权利要求1所述的一种自动生成情感文本的方法,其特征在于,所述获取待处理文章和不同情感倾向类别对应的预设社交短文本模板之前包括:获取训练评论;根据TF

IDF词频统计方法计算出所述训练评论中每一训练评论对应的高频词集合;根据所述高频词集合及情感敏感表得到所述每一训练评论对应的情感倾向类别;根据所述情感倾向类别对应的所述训练评论得到所述情感倾向类别对应的社交短文本模板。4.根据权利要求3所述的一种自动生成情感文本的方法,其特征在于,所述根据所述情感倾向类别对应的所述训练评论得到所述情感倾向类别对应的社交短文本模板包括:去除所述情感倾向类别对应的所述训练评论中的主题词、前缀及后缀,并保留主题词空缺得到所述社交短文本模板。5.根据权利要求4所述的一种自动生成情感文本的方法,其特在于,所述据所述主题关键词填充所述社交短文本模板,得到情感文本并输出包括:根据所述主题关键词填充所述社交短文本模板中的主题词空缺,得到情感文本并输出。6.根据权利要求1所述的一种自动生成情感文本的方法,其特征在于,所述根据所述待处理文章得到主题关键词还包括:根据所述待处理文章得到文章摘要;所述根据所述主题...

【专利技术属性】
技术研发人员:薛健武董云侠林志扬
申请(专利权)人:厦门市美亚柏科信息股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1