【技术实现步骤摘要】
一种自动生成情感文本的方法及终端
[0001]本专利技术涉及自然语言处理领域,尤其涉及一种自动生成情感文本的方法及终端。
技术介绍
[0002]现有技术对文本生成方法主要采用深度学习方法,涉及整理海量且质优的训练数据集进行训练,通过模型输入到输出直接生成最终文本的方式。其中,对训练集的数据要求很高,具体表现为两个难点,第一是源数据必须保证输入输出部分,在内容上保持强联系并输出倾向;其次海量的训练数据标记需要大量的人工成本。因此考虑到人力物力的投入成本,很难制作一个优质的训练数据集,当数据集质量不能得到保证的情况下,现存在的很多训练好的模型生成的文本就表现为质量较低,与文章或话题主题并无强联系,不能起到很好的效果,并且低质量言论信息或明显的机器生成文本内容也很难通过所发布的社交平台的检测机制,不能在没有人工干预的情况下直接作为实际应用。
技术实现思路
[0003]本专利技术所要解决的技术问题是:提供一种自动生成情感文本的方法及终端,实现高质量文本语料的生成。
[0004]为了解决上述技术问题,本专利技术 ...
【技术保护点】
【技术特征摘要】
1.一种自动生成情感文本的方法,其特征在于,包括步骤:获取待处理文章和不同情感倾向类别对应的社交短文本模板;根据所述待处理文章得到主题关键词;根据所述主题关键词填充所述社交短文本模板,得到情感文本并输出。2.根据权利要求1所述的一种自动生成情感文本的方法,其特征在于,所述根据所述待处理文章得到主题关键词包括:将所述待处理文章输入长短期记忆网络模型,得到关键词向量和语义向量;将所述关键词向量和所述语义向量做注意力操作,得到主题关键词向量;根据所述主题关键词向量得到主题关键词。3.根据权利要求1所述的一种自动生成情感文本的方法,其特征在于,所述获取待处理文章和不同情感倾向类别对应的预设社交短文本模板之前包括:获取训练评论;根据TF
‑
IDF词频统计方法计算出所述训练评论中每一训练评论对应的高频词集合;根据所述高频词集合及情感敏感表得到所述每一训练评论对应的情感倾向类别;根据所述情感倾向类别对应的所述训练评论得到所述情感倾向类别对应的社交短文本模板。4.根据权利要求3所述的一种自动生成情感文本的方法,其特征在于,所述根据所述情感倾向类别对应的所述训练评论得到所述情感倾向类别对应的社交短文本模板包括:去除所述情感倾向类别对应的所述训练评论中的主题词、前缀及后缀,并保留主题词空缺得到所述社交短文本模板。5.根据权利要求4所述的一种自动生成情感文本的方法,其特在于,所述据所述主题关键词填充所述社交短文本模板,得到情感文本并输出包括:根据所述主题关键词填充所述社交短文本模板中的主题词空缺,得到情感文本并输出。6.根据权利要求1所述的一种自动生成情感文本的方法,其特征在于,所述根据所述待处理文章得到主题关键词还包括:根据所述待处理文章得到文章摘要;所述根据所述主题...
【专利技术属性】
技术研发人员:薛健武,董云侠,林志扬,
申请(专利权)人:厦门市美亚柏科信息股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。