一种生成一致性写作风格文档的方法、设备、存储介质技术

技术编号:32832561 阅读:13 留言:0更新日期:2022-03-26 20:47
本申请公开了一种生成一致性写作风格文档的方法、设备、存储介质,该方法包括:通过协同写作平台获取主作者文档,将所述主作者文档输入到文档编码器中,生成上下文向量;通过协同写作平台获取从作者文档,将所述从作者文档输入到所述文档编码器,生成文档语句向量集合;将所述上下文向量和所述文档语句向量集合输入到协同写作模型中,生成与主作者风格相同的合作文档;生成多个合作文档,根据作者写作风格判别器和所述作者内容合理判别器进行评估,选择相似度最高的合作文档作为最终文档。选择相似度最高的合作文档作为最终文档。选择相似度最高的合作文档作为最终文档。

【技术实现步骤摘要】
一种生成一致性写作风格文档的方法、设备、存储介质


[0001]本申请涉及自然语言处理领域,尤其涉及一种生成一致性写作风格文档的方法、设备、存储介质。

技术介绍

[0002]近年来,强化学习技术受到了大家的广泛关注,特别是与深度学习结合,给人工智能领域带来了很大的进展。强化学习不同于传统的监督学习,主要表现在强化信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价。
[0003]随着互联网的发展,数字内容生产越来越受重视,协同写作逐渐成为内容生产的重要手段。协同写作或合作写作是指由多人一起,而非个人单独完成的写作计划,多以众包与分发的形式,实现高效内容的生产与协同。
[0004]由于参与协同写作的作者写作风格的不同,在格式或内容上,最终产出的文档作品往往出现内容、风格等不一致的问题,影响读者的阅读质量。
[0005]基于此,需要一种能够使协同化写作的文档内容、风格一致性的方案,以更好地提升用户阅读体验。

技术实现思路

[0006]本申请提供了一种生成一致性写作风格文档的方法、设备、存储介质,解决了在多人协同写作时导致写作风格、写作内容等不一致的技术问题。
[0007]一种生成一致性写作风格文档的方法,包括:
[0008]通过协同写作平台获取主作者文档,将所述主作者文档输入到文档编码器中,生成上下文向量;
[0009]通过协同写作平台获取从作者文档,将所述从作者文档输入到所述文档编码器,生成文档语句向量集合;
[0010]将所述上下文向量和所述文档语句向量集合输入到协同写作模型中,生成与主作者风格相同的合作文档;
[0011]生成多个合作文档,根据作者写作风格判别器和所述作者内容合理判别器进行评估,选择相似度最高的合作文档作为最终文档。
[0012]在本申请的一种实施例中,在通过所述协同写作模型生成合作文档之前,所述方法还包括:对双向编码表征变换器BERT进行预训练,包括:采集协同写作平台中的作者的文字内容形成文档库;在所述文档库中选取所述作者的文档,通过所述作者的文档对BERT通用模型进行训练,得到个性化的BERT作者模型;根据所述BERT通用模型和所述BERT作者模型,训练得到作者内容生成器;根据所述BERT作者模型和线性分类器,训练得到作者写作风格判别器;根据所述BERT作者模型和所述线性分类器,训练得到作者内容合理性判别器。
[0013]在本申请的一种实施例中,在通过所述协同写作模型生成合作文档之前,所述方法还包括:对所述协同写作模型进行训练,包括:在所述协同写作平台下载文档,将主作者
文档输入文档编码器,生成所述主作者文档的上下文向量;将从作者文档输入所述文档编码器生成所述从作者文档的语句向量集合;将所述上下文向量和所述语句向量集合通过所述作者内容生成器,构建语句序列;将所述语句序列输入到所述协同写作模型中,对所述协同写作模型进行训练,生成合作文档;将生成的所述合作文档与反馈环境进行交互,得到反馈结果;将所述反馈结果传输到所述协同写作模型中,所述协同写作模型根据所述反馈结果更新网络参数,训练得到进一步优化的协同写作模型。
[0014]在本申请的一种实施例中,将生成的所述合作文档与反馈环境进行交互,得到反馈结果,具体包括:根据作者写作风格判别器、作者内容合理判别器以及读者反馈形成反馈环境,确定奖励函数;将生成的所述合作文档与反馈环境进行交互,根据所述奖励函数计算得到反馈结果。
[0015]在本申请的一种实施例中,所述根据作者写作风格判别器和所述作者内容合理判别器进行评估,选择相似度最高的合作文档作为最终文档,具体包括:根据所述作者写作风格判别器判断各个合作文档与作者写作风格相似度;根据所述作者内容合理判别器判断各个合作文档与作者写作内容相似度;对各个合作文档的所述作者写作风格和所述作者内容计算的值进行加权处理,得到各个合作文档最终的相似度值;对各个文档的所述相似度值进行比较,确定最高的所述相似度值对应的合作文档,作为最终文档。
[0016]在本申请的一种实施例中,所述对所述协同写作模型进行训练,具体包括:通过A3C算法训练所述协同写作模型;利用多个worker线程采用与全局模型公共神经网络一样的网络结构,生成合作文档;将所述合作文档输入所述反馈环境获得反馈结果;根据所述反馈结果形成最终的文档生成策略。
[0017]在本申请的一种实施例中,所述采集协同写作平台中的作者的文字内容之前,所述方法还包括:由协同写作平台接收作者的注册,对所述作者身份进行审核并进行标记;接收作者在诉述协同写作平台上传的文档;当出现新注册的作者上传的文档时,自动获取新作者的文档进行训练。
[0018]一种生成一致性写作风格文档的设备,包括:
[0019]至少一个处理器;以及,
[0020]与所述至少一个处理器通信连接的存储器;其中,
[0021]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
[0022]通过协同写作平台获取主作者文档,将所述主作者文档输入到文档编码器中,生成上下文向量;
[0023]通过协同写作平台获取从作者文档,将所述从作者文档输入到所述文档编码器,生成文档语句向量集合;
[0024]将所述上下文向量和所述文档语句向量集合输入到协同写作模型中,生成与主作者风格相同的合作文档;
[0025]生成多个合作文档,根据作者写作风格判别器和所述作者内容合理判别器进行评估,选择相似度最高的合作文档作为最终文档。
[0026]在本申请的一种实施例中,所述至少一个处理器还用于:对双向编码表征变换器BERT进行预训练,包括:采集协同写作平台中的作者的文字内容形成文档库;在所述文档库
中选取所述作者的文档,通过所述作者的文档对BERT通用模型进行训练,得到个性化的BERT作者模型;根据所述BERT通用模型和所述BERT作者模型,训练得到作者内容生成器;根据所述BERT作者模型和线性分类器,训练得到作者写作风格判别器;根据所述BERT作者模型和所述线性分类器,训练得到作者内容合理性判别器。
[0027]一种非易失性存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:
[0028]通过协同写作平台获取主作者文档,将所述主作者文档输入到文档编码器中,生成上下文向量;
[0029]通过协同写作平台获取从作者文档,将所述从作者文档输入到所述文档编码器,生成文档语句向量集合;
[0030]将所述上下文向量和所述文档语句向量集合输入到协同写作模型中,生成与主作者风格相同的合作文档;
[0031]生成多个合作文档,根据作者写作风格判别器和所述作者内容合理判别器进行评估,选择相似度最高的合作文档作为最终文档。
[0032]本申请提供了一种生成一致性写作风格文档的方法、设备、存储介质,至少包括以下有益效果:通过收集海量协同写作参与者的文字内容形成本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种生成一致性写作风格文档的方法,其特征在于,包括:通过协同写作平台获取主作者文档,将所述主作者文档输入到文档编码器中,生成上下文向量;通过协同写作平台获取从作者文档,将所述从作者文档输入到所述文档编码器,生成文档语句向量集合;将所述上下文向量和所述文档语句向量集合输入到协同写作模型中,生成与主作者风格相同的合作文档;生成多个合作文档,根据作者写作风格判别器和所述作者内容合理判别器进行评估,选择相似度最高的合作文档作为最终文档。2.根据权利要求1所述的方法,其特征在于,在通过所述协同写作模型生成合作文档之前,所述方法还包括:对双向编码表征变换器BERT进行预训练,包括:采集协同写作平台中的作者的文字内容形成文档库;在所述文档库中选取所述作者的文档,通过所述作者的文档对BERT通用模型进行训练,得到个性化的BERT作者模型;根据所述BERT通用模型和所述BERT作者模型,训练得到作者内容生成器;根据所述BERT作者模型和线性分类器,训练得到作者写作风格判别器;根据所述BERT作者模型和所述线性分类器,训练得到作者内容合理性判别器。3.根据权利要求2所述的方法,其特征在于,在通过所述协同写作模型生成合作文档之前,所述方法还包括:对所述协同写作模型进行训练,包括:在所述协同写作平台下载文档,将主作者文档输入文档编码器,生成所述主作者文档的上下文向量;将从作者文档输入所述文档编码器生成所述从作者文档的语句向量集合;将所述上下文向量和所述语句向量集合通过所述作者内容生成器,构建语句序列;将所述语句序列输入到所述协同写作模型中,对所述协同写作模型进行训练,生成合作文档;将生成的所述合作文档与反馈环境进行交互,得到反馈结果;将所述反馈结果传输到所述协同写作模型中,所述协同写作模型根据所述反馈结果更新网络参数,训练得到进一步优化的协同写作模型。4.根据权利要求3所述的方法,其特征在于,将生成的所述合作文档与反馈环境进行交互,得到反馈结果,具体包括:根据作者写作风格判别器、作者内容合理判别器以及读者反馈形成反馈环境,确定奖励函数;将生成的所述合作文档与反馈环境进行交互,根据所述奖励函数计算得到反馈结果。5.根据权利要求1所述的方法,其特征在于,所述根据作者写作风格判别器和所述作者内容合理判别器进行评估,选择相似度最高的合作文档作为最终文档,具体包括:根据所述作者写作风格判别器判断各个合作文档与作者写作风格相似度;根据所述作者内容合理判别器判断各个合作文档与作者写作内容相似度;
对各个合作文档的所述作者写作风格和所述作者内容计算的值进行加权处理,得到各个合作文档最终的相似度值;对各个文...

【专利技术属性】
技术研发人员:罗清彩孙善宝蒋梦梦张晖解萌于晓艳张鑫
申请(专利权)人:山东浪潮科学研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1