一种基于记忆自然语言大模型的长文本写作方法和装置制造方法及图纸

技术编号：42668608 阅读：24 留言：0更新日期：2024-09-10 12:23

本发明专利技术公开了一种基于记忆自然语言大模型的长文本写作方法和装置，包括：获取写作要求和参考文献，并将参考文献解析为文本；将写作要求和解析得到的文本输入至记忆自然语言大模型，记忆自然语言大模型根据写作要求为文本中不同内容赋予不同权重，同时生成不同内容的总结概要，并将总结概要存入向量数据库；迭代基于滑动窗口内容的写作过程，包括：构建包含第四系统提示词、前文缩略、写作重点内容以及参考内容概括的当前滑动窗口内容，写作自然大语言模型基于当前滑动窗口内容进行写作，输出当前滑动窗口对应的新写作文本并合并到历史写作文本。这样能够实现在用户输入写作要求和参考文献后即可输出上下文连贯且考虑参考文献的长文本内容。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于自然语言处理，具体涉及一种基于记忆自然语言大模型的长文本写作方法和装置。

技术介绍

1、在当今信息时代，随着互联网的普及和大数据技术的发展，人们对于文本信息的需求不断增长。长文本写作在各种领域中具有广泛的应用，如新闻报道、学术论文、小说创作等。然而，传统的文本生成方法往往存在效率低、质量不高等问题，难以满足人们日益增长的需求。

2、近年来，自然语言处理(natural language processing，nlp)技术取得了显著的进展，特别是基于深度学习的自然语言大模型(如gpt、bert等)在文本生成方面表现出了强大的能力。这些模型通过大量文本数据的训练，能够生成具有较高质量和连贯性的文本。

3、然而，现有的自然语言大模型(large language model，llm)往往有上下文(context)大小的限制，即token的长度有限制，这使得现有的自然语言大模型在进行写作时会出现无法生成长文本内容。再者，基于自然语言大模型的长文本写作方法往往是选择遗忘之前的内容，只使用最新的文本内容进行生成...

【技术保护点】

1.一种基于记忆自然语言大模型的长文本写作方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于记忆自然语言大模型的长文本写作方法，其特征在于，所述记忆自然语言大模型在被应用之前经过调试，调试过程包括：

3.根据权利要求1所述的基于记忆自然语言大模型的长文本写作方法，其特征在于，还包括：当参考文献为PDF文件时，采用pypdf包解析PDF文件得到文本；

4.根据权利要求1所述的基于记忆自然语言大模型的长文本写作方法，其特征在于，所述概括自然语言大模型在被应用之前经过调试，调试过程包括：

5.根据权利要求1所述的基于记忆自然语言大模型...

【技术特征摘要】

1.一种基于记忆自然语言大模型的长文本写作方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于记忆自然语言大模型的长文本写作方法，其特征在于，所述记忆自然语言大模型在被应用之前经过调试，调试过程包括：

3.根据权利要求1所述的基于记忆自然语言大模型的长文本写作方法，其特征在于，还包括：当参考文献为pdf文件时，采用pypdf包解析pdf文件得到文本；

4.根据权利要求1所述的基于记忆自然语言大模型的长文本写作方法，其特征在于，所述概括自然语言大模型在被应用之前经过调试，调试过程包括：

5.根据权利要求1所述的基于记忆自然语言大模型的长文本写作方法，其特征在于，所述基于写作重点内容在向量数据库中搜索相似的总结概要作为参考内容，包括：

6.根据权利要求1所述的...

【专利技术属性】
技术研发人员：张邓明，易和阳，孙凌云，梅冬，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人