【技术实现步骤摘要】
基于生成式对抗网络模型的新闻评论自动生成方法及系统
本专利技术涉及一种新闻评论自动生成方法及系统,尤其是一种基于生成式对抗网络模型的新闻评论自动生成方法及系统,属于新闻评论自动生成
技术介绍
经典的网络之循环神经网络(RecurrentNeuralNetwork,简称RNN),这一网络也是序列数据的首选网络。当涉及某些顺序机器学习任务时,RNN可以达到很高准确度。RNNs的目的使用来处理序列数据,在传统的神经网络模型中,是从输入层到隐含层再到输出层,层与层之间是全连接的,每层之间的节点是无连接的。但是这种普通的神经网络对于很多问题却无能无力。例如,你要预测句子的下一个单词是什么,一般需要用到前面的单词,因为一个句子中前后单词并不是独立的。RNNs之所以称为循环神经网路,即一个序列当前的输出与前面的输出也有关。具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中,即隐藏层之间的节点不再无连接而是有连接的,并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出。理论上,RNNs能够对任何长度的序列数据进行处理。生成式对抗网络(Gener ...
【技术保护点】
1.基于生成式对抗网络模型的新闻评论自动生成方法,其特征在于,所述方法包括:获取多组目标特征新闻标题数据;对所述新闻标题数据进行预处理来构造训练数据,将所述训练数据输入长短期记忆网络‑循环神经网络模型进行训练,得到样本数据;将长短期记忆网络‑循环神经网络模型作为生成器,并在长短期记忆网络‑循环神经网络模型中加入鉴别器,对生成器与鉴别器进行博弈对抗训练,达到纳什均衡,形成生成式对抗网络模型;通过不断训练所述样本数据,修正生成式对抗网络模型,将修正后的生成式对抗网络模型作为预生成新闻评论模型;加载预生成新闻评论模型,并设置输出参数调整预生成新闻评论模型,输出得到新闻评论。
【技术特征摘要】
1.基于生成式对抗网络模型的新闻评论自动生成方法,其特征在于,所述方法包括:获取多组目标特征新闻标题数据;对所述新闻标题数据进行预处理来构造训练数据,将所述训练数据输入长短期记忆网络-循环神经网络模型进行训练,得到样本数据;将长短期记忆网络-循环神经网络模型作为生成器,并在长短期记忆网络-循环神经网络模型中加入鉴别器,对生成器与鉴别器进行博弈对抗训练,达到纳什均衡,形成生成式对抗网络模型;通过不断训练所述样本数据,修正生成式对抗网络模型,将修正后的生成式对抗网络模型作为预生成新闻评论模型;加载预生成新闻评论模型,并设置输出参数调整预生成新闻评论模型,输出得到新闻评论。2.根据权利要求1所述的新闻评论自动生成方法,其特征在于,所述对所述新闻标题数据进行预处理来构造训练数据,具体为:在所述新闻标题数据中得到字符与行号对应的索引字典,将字符数据集映射成为索引数据集,在索引数据集中得到字符-数字的映射和数字-字符的映射,建立长短期记忆网络-循环神经网络模型的输入词嵌入向量,将输入词嵌入向量作为训练数据。3.根据权利要求1所述的新闻评论自动生成方法,其特征在于,所述长短期记忆网络-循环神经网络模型包括输入层、隐藏层、输出层和长短期记忆网络层,其中长短期记忆网络层、隐藏层以及隐藏层节点个数均由输入参数决定。4.根据权利要求1所述的新闻评论自动生成方法,其特征在于,所述对生成器与鉴别器进行博弈对抗训练,具体为:对生成器与鉴别器进行一个极小极大的博弈对抗训练。5.根据权利要求1所述的新闻评论自动生成方法,其特征在于,所述鉴别器采用卷积神经网络;所述对生成器与鉴别器进行博弈对抗训练,具体为:利用策略梯度强化学习对生成器与鉴别器进行博弈对抗训练;其中,在博弈对抗训练开始时,使用极大似然估计法对生成器进行预训练,直到生成器达到收敛为止。6.根据权利要求1-5任一项所述的新闻评论自动生成方法,其特征在于,所述长短期记忆网络-循环神经网络模型的公式如下:it=σ((Wxixt+Whiht-1)ft=σ(...
【专利技术属性】
技术研发人员:朱静,杨晋昌,黄颖杰,黄文恺,
申请(专利权)人:广州大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。