一种生成一致性写作风格文档的方法、设备、存储介质技术

技术编号：32832561 阅读：13 留言：0更新日期：2022-03-26 20:47

本申请公开了一种生成一致性写作风格文档的方法、设备、存储介质，该方法包括：通过协同写作平台获取主作者文档，将所述主作者文档输入到文档编码器中，生成上下文向量；通过协同写作平台获取从作者文档，将所述从作者文档输入到所述文档编码器，生成文档语句向量集合；将所述上下文向量和所述文档语句向量集合输入到协同写作模型中，生成与主作者风格相同的合作文档；生成多个合作文档，根据作者写作风格判别器和所述作者内容合理判别器进行评估，选择相似度最高的合作文档作为最终文档。选择相似度最高的合作文档作为最终文档。选择相似度最高的合作文档作为最终文档。

全部详细技术资料下载

【技术实现步骤摘要】
一种生成一致性写作风格文档的方法、设备、存储介质

[0001]本申请涉及自然语言处理领域，尤其涉及一种生成一致性写作风格文档的方法、设备、存储介质。

技术介绍

[0002]近年来，强化学习技术受到了大家的广泛关注，特别是与深度学习结合，给人工智能领域带来了很大的进展。强化学习不同于传统的监督学习，主要表现在强化信号上，强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价。
[0003]随着互联网的发展，数字内容生产越来越受重视，协同写作逐渐成为内容生产的重要手段。协同写作或合作写作是指由多人一起，而非个人单独完成的写作计划，多以众包与分发的形式，实现高效内容的生产与协同。
[0004]由于参与协同写作的作者写作风格的不同，在格式或内容上，最终产出的文档作品往往出现内容、风格等不一致的问题，影响读者的阅读质量。
[0005]基于此，需要一种能够使协同化写作的文档内容、风格一致性的方案，以更好地提升用户阅读体验。

技术实现思路

[0006]本申请提供了一种生成一致性写作风格文档的方法、设备、存储介质，解决了在多人协同写作时导致写作风格、写作内容等不一致的技术问题。
[0007]一种生成一致性写作风格文档的方法，包括：
[0008]通过协同写作平台获取主作者文档，将所述主作者文档输入到文档编码器中，生成上下文向量；
[0009]通过协同写作平台获取从作者文档，将所述从作者文档输入到所述文档编码器，生成文档语句向量集合；
[0010]将所述上下文向...

【技术保护点】

【技术特征摘要】
1.一种生成一致性写作风格文档的方法，其特征在于，包括：通过协同写作平台获取主作者文档，将所述主作者文档输入到文档编码器中，生成上下文向量；通过协同写作平台获取从作者文档，将所述从作者文档输入到所述文档编码器，生成文档语句向量集合；将所述上下文向量和所述文档语句向量集合输入到协同写作模型中，生成与主作者风格相同的合作文档；生成多个合作文档，根据作者写作风格判别器和所述作者内容合理判别器进行评估，选择相似度最高的合作文档作为最终文档。2.根据权利要求1所述的方法，其特征在于，在通过所述协同写作模型生成合作文档之前，所述方法还包括：对双向编码表征变换器BERT进行预训练，包括：采集协同写作平台中的作者的文字内容形成文档库；在所述文档库中选取所述作者的文档，通过所述作者的文档对BERT通用模型进行训练，得到个性化的BERT作者模型；根据所述BERT通用模型和所述BERT作者模型，训练得到作者内容生成器；根据所述BERT作者模型和线性分类器，训练得到作者写作风格判别器；根据所述BERT作者模型和所述线性分类器，训练得到作者内容合理性判别器。3.根据权利要求2所述的方法，其特征在于，在通过所述协同写作模型生成合作文档之前，所述方法还包括：对所述协同写作模型进行训练，包括：在所述协同写作平台下载文档，将主作者文档输入文档编码器，生成所述主作者文档的上下文向量；将从作者文档输入所述文档编码器生成所述从作者文档的语句向量集合；将所述上下文向量和所述语句向量集合通过所述作者内容生成器，构建语句序列；将所述语句序列输入到所述协同写作模型中，对所述协同写作模型进行训练，生成合作文档；将生成的所述合作文档与反馈环境进行交互，得到反馈结果；将所述反馈结果传输到所述协同写作模型中，所述协同写作模型根据所述反馈结果更新网络参数，训练得到进一步优化的协同写作模型。4.根据权利要求3所述的方法，其特征在于，将生成的所述合作文档与反馈环境进行交互，得到反馈结果，具体包括：根据作者写作风格判别器、作者内容合理判别器以及读者反馈形成反馈环境，确定奖励函数；将生成的所述合作文档与反馈环境进行交互，根据所述奖励函数计算得到反馈结果。5.根据权利要求1所述的方法，其特征在于，所述根据作者写作风格判别器和所述作者内容合理判别器进行评估，选择相似度最高的合作文档作为最终文档，具体包括：根据所述作者写作风格判别器判断各个合作文档与作者写作风格相似度；根据所述作者内容合理判别器判断各个合作文档与作者写作内容相似度；
对各个合作文档的所述作者写作风格和所述作者内容计算的值进行加权处理，得到各个合作文档最终的相似度值；对各个文...

【专利技术属性】
技术研发人员：罗清彩，孙善宝，蒋梦梦，张晖，解萌，于晓艳，张鑫，
申请(专利权)人：山东浪潮科学研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人