一种文本的生成器模型训练方法技术

技术编号:37190474 阅读:26 留言:0更新日期:2023-04-20 22:52
本申请的实施例揭示了一种文本的生成器模型训练方法,所述方法包括:获取用于模型训练的数据集,所述数据集中包括多个标注完成的话题文本;将所述数据集输入生成器模型,得到所述生成器模型生成的文本;基于所述生成器模型生成的文本以及所述数据集中的训练文本对所述生成器模型进行训练优化,使得优化完成的所述生成器模型能够生成与话题文本接近的文本,通过上述方法训练处的生成器模型能够自动生成符合真实话题文本的文本,避免了相关技术中通过机器写作单调重复的发布相同言论的网评话题文本,导致效果差的问题。导致效果差的问题。导致效果差的问题。

【技术实现步骤摘要】
一种文本的生成器模型训练方法


[0001]本申请涉及一种模型训练
,尤其涉及一种文本的生成器模型训练方法。

技术介绍

[0002]社交网络一向是用户获取新闻、畅所欲言的最佳平台,目前已是人们日常生活中不可或缺的一部分。然而,社交网络中并非只存在真实、正向的信息,虚假、恶意的言论也充斥其中。有些组织和个人甚至动用社交机器人通过机器写作或智能写作的方式,针对某一事件或热点话题在短时间内通过多个账号连续大量发布特定倾向的言论,由此达到颠倒黑白、不可告人的目的。有些敌对势力甚至将其作为发动信息战的一种强有力手段。由此,不仅可能引发恶意事件的发生舆情,甚至可能导致社交平台被控制和利用,丧失网络控制权。不仅会影响社交网络的健康发展,而且会破坏社会的和谐与稳定[1]。
[0003]为了正确的引导舆论走向,对社交网络中发布的大量恶意信息加以有效的反制,可以通过在短时间内投放大量具有积极舆论效应的话题文本至社交网络中[2],从而改变人们对于负向舆论及恶意舆情事件的认知,扭转社会舆论的走向的方式,打赢信息战。但是,仅仅依靠人工书写及发布网评话题文本,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本的生成器模型训练方法,其特征在于,所述方法包括:获取用于模型训练的数据集,所述数据集中包括多个标注完成的话题文本;将所述数据集输入生成器模型,得到所述生成器模型生成的文本;基于所述生成器模型生成的文本以及所述数据集中的训练文本对所述生成器模型进行训练优化,使得优化完成的所述生成器模型能够生成与话题文本接近的文本。2.根据权利要求1所述的方法,其特征在于,获取用于模型训练的数据集,包括:获取初始训练集,所述初始训练集中包括多个获取的话题文本;对所述初始训练集中的话题文本进行价值观倾向筛选,得到符合当前所需价值观倾向的话题文本;对所有符合当前所需价值观倾向的话题文本进行情感倾向标注后,对所有符合当前所需价值观倾向的话题文本进行分词,得到用于模型训练的所述训练集。3.根据权利要求1所述的方法,其特征在于,将所述数据集输入生成器模型,得到所述生成器模型生成的文本,包括:将所述数据集输入所述生成器模型的编码器,得到所述数据集中每个话题文本对应的语义向量,生成语义向量集;将所述语义向量集输入到所述生成器模型的解码器,得到所述语义向量集中每个语义向量对应的解码向量矩阵;对所述解码向量矩阵进行维度转换,得到所述生成器模型生成的文本。4.根据权利要求1所述的方法,其特征在于,将所述数据集输入所述生成器模型的编码器,得到所述数据集中每个话题文本对应的语义向量,生成语义向量集,包...

【专利技术属性】
技术研发人员:金昊高阳阳王迎雪林晖刘弋锋黎宏河
申请(专利权)人:中国电子科技集团公司电子科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1