一种提升AI大模型生成内容质量的方法及装置制造方法及图纸

技术编号：41368653 阅读：3 留言：0更新日期：2024-05-20 10:15

本发明专利技术提供一种提升AI大模型生成内容质量的方法及装置，方法包括：收集大量高质量的原始提示词及其对应的详细描述的数据；数据预处理；基于AI大模型的框架，选择合适的模型参数，设计增加提示词增强模块的模型结构；使用数据集训练提示词增强模块；测试训练完成后的模型，评估模型性能和准确性；将训练好的提示词增强模块集成到AI大模型中，自动将简短提示词转换为对简短提示词的详细描述，将输出的详细描述输入给AI大模型生成高质量的回复内容。本发明专利技术提高AI大模型生成内容质量，降低用户使用AI大模型门槛；通过提示词转换显著提高AI大模型生成内容的准确性、相关性和有用性；能广泛应用于各种需要AI大模型进行内容生成的场景。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能，特别地，涉及ai大模型、提示词工程；具体而言，涉及一种提升ai大模型生成内容质量的方法及装置。

技术介绍

1、在人工智能领域，ai大模型已经成为一种重要的技术手段。

2、ai大模型通常具有强大的语言理解和生成能力，能够根据输入的提示词生成高质量的内容。用户可通过提示词的方式让ai大模型输出对应的内容，如图1所示。

3、对于ai大模型，输入的提示词信息越详细、全面、准确，ai大模型的回复质量就越高。ai大模型在接收简短、模糊的提示词时，生成内容质量不高。因此，为获得高质量的生成内容，需用户提供详细、全面、准确的提示词。

4、然而，撰写详细、全面、准确的提示词的工作，对于大部分用户是一项耗时耗力的任务。在现有技术中需要花费大量的时间和精力撰写高质量的提示词，增加了用户使用ai大模型的门槛。

5、此外，对于一些不熟悉ai大模型或者没有足够专业知识的用户，不能够提供足够详细和准确的提示词，也会导致ai大模型生成的内容质量不高。

技术实现思路

1、鉴于此，本专利技术的目的在于提出一种提升ai大模型生成内容质量的方法及装置，基于ai大模型的框架增加一个提示词增强模块，能够将用户输入的简短提示词转换为详细、全面、准确的详细说明，从而提高ai大模型生成内容的质量，降低用户使用ai大模型的门槛；通过提示词转换，使ai大模型可以基于更高质量、更具体的信息生成内容，从而显著提高生成内容的准确性、相关性和有用性。

2、本专

3、s1、收集大量高质量的原始提示词及其对应的详细描述的数据；

4、所述高质量的原始提示词及其对应的详细描述满足以下标准：

5、(1)所述原始提示词应当简洁、清晰、直接，避免歧义；

6、(2)所述详细描述涵盖所述原始提示词的全部要点，并对原始提示词进行扩展和补充，使原始提示词更具体、更明确；例如，对于原始提示词“写一篇关于ai的文章”，其详细描述可以是：“请写一篇关于人工智能的发展历程、主要应用领域、面临的问题和未来发展趋势的综述文章。”

7、(3)所述详细描述准确反映所述原始提示词的意图，所述详细描述和所述原始提示词在内容上保持一致；

8、(4)所述详细描述的语言表达准确、流畅，避免歧义。

9、(5)所述详细描述需提供足够的信息，使ai模型能够根据该详细描述生成高质量的内容。

10、s2、对收集到的高质量的原始提示词及其对应的详细描述的数据进行预处理，所述预处理包括：清洗、去重、标注和格式化，保证数据的质量和一致性；将处理后的数据作为后续模型训练的数据集；

11、s3、基于ai大模型的框架，选择合适的模型参数，设计增加提示词增强模块的模型结构；

12、s4、使用预处理后的数据集对增加提示词增强模块的模型进行训练，训练所述提示词增强模块；所述提示词增强模块的输入为用户的原始提示词，输出为对原始提示词的详细、全面、准确的描述；

13、llama2、qwen2和bert模型都是基于transformer架构的不同变体，它们通过不同的设计选择和训练策略来优化各自的性能和应用范围。这些模型在自然语言处理领域都取得了显著的成果，并在多种任务中实现了最先进的表现。

14、(1)llama2是一种大型的语言模型，llama2模型采用先进的深度学习技术处理自然语言处理(nlp)任务。llama2模型在生成连贯且相关的文本方面性能出色。llama2模型的结构是基于多层transformer架构的包含自注意力机制的神经网络结构，能够捕捉输入序列中长距离的依赖关系。llama2模型通过堆叠多个层来增加模型的复杂性，从而提高在各种nlp任务上的表现。

15、(2)qwen2模型同样基于transformer架构，但是进行了一些修改以适应特定的应用场景，这些修改包括嵌入层和输出投影的选择，以及位置编码的使用。不同于一些模型将输入嵌入和输出投影的权重绑定在一起，qwen2模型选择非约束的嵌入方法，可以更好地控制内存开销，同时保持模型的性能。此外，qwen2模型还采用旋转位置编码(rope)将位置信息融入模型中，这种位置编码已经在许多大型语言模型中得到了成功的应用。

16、(3)bert：bert模型是另一种著名的nlp框架，它同样基于transformer的编码器部分构建而成。bert模型的特点在于预训练和微调的策略。在预训练阶段，bert模型通过在大量文本数据上执行掩码语言建模和下一个句子预测任务来学习深层的语言表示，然后在微调阶段，bert模型的表示可以针对特定的nlp任务(如问答、命名实体识别等)进行调整，通常只需要在预训练得到的模型基础上添加一个输出层即可。

17、s5、对训练完成后的所述模型进行测试，评估模型的性能和准确性；

18、s6、将训练好的提示词增强模块集成到ai大模型中，所述提示词增强模块自动将用户输入的简短提示词转换为详细、全面、准确的描述，然后将详细、全面、准确的描述输入给ai大模型生成高质量的回复内容。

19、比如，用户输入的简短提示词是：“作为一个方言翻译员，可以将普通话翻译为四川话。”。经过提示词增强模块的处理，可能转换成以下详细描述：

20、“川语转换器是一款专门用于方言转换的工具，它的核心功能是将用户输入的普通话内容转换为地道的四川话表达。这款工具不仅具备基本的普通话输入理解和四川话输出转换能力，还能够根据对话的上下文适当调整四川方言的词汇和表达方式，确保转换结果的准确性和自然度。在配置信息方面，川语转换器被定义为一款具有幽默风趣风格的四川话交流助手。它具备以下能力：

21、1.普通话输入理解：川语转换器能够准确理解用户输入的普通话内容，这是实现后续转换的基础。

22、2.四川话输出转换：将理解的内容转换成地道的四川话表达，这是转换器的主体功能。

23、3.语境适应调整：根据对话的上下文，适当使用四川方言的词汇和表达方式，使转换结果更加符合实际语境。

24、在细节方面，川语转换器注重以下几个方面：

25、1.转换准确度：保证四川话翻译的准确性和自然度，这是衡量转换效果的重要标准。

26、2.词汇更新：定期更新词汇库，确保方言的时效性和流行度，以适应不断变化的语言环境。

27、3.适用场景：适用于日常交流、娱乐互动等需要四川话表达的场合，满足不同用户的需求。”。

28、进一步地，所述s5步骤的对训练完成后的所述模型进行测试的方法主要包括以下步骤：

29、s51、从原始提示词及其详细描述的数据集中划分出测试集，使得测试集能够全面评估模型的性能；

30、s52、将测试集中的原始提示词输入到训练好的模型，通过模型生成对应的详细描述；

31、s本文档来自技高网...

【技术保护点】

1.一种提升AI大模型生成内容质量的方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的提升AI大模型生成内容质量的方法，其特征在于，所述S5步骤的对训练完成后的所述模型进行测试的方法主要包括以下步骤：

3.根据权利要求2所述的提升AI大模型生成内容质量的方法，其特征在于，所述S53步骤的评估模型的性能的评估方法包括以下一种或两种的组合：

4.根据权利要求1所述的提升AI大模型生成内容质量的方法，其特征在于，所述S4步骤的对增加提示词增强模块的模型进行训练的方法包括以下步骤：

5.根据权利要求1所述的提升AI大模型生成内容质量的方法，其特征在于，所述S1步骤的所述高质量的原始提示词及其对应的详细描述的数据的获取方式包括：从现有的AI大模型生成内容中获取，或者，通过人工撰写或编辑获得；

6.一种提升AI大模型生成内容质量的装置，执行如权利要求1-5任一项所述的提升AI大模型生成内容质量的方法，其特征在于，包括：

7.根据权利要求6所述的提升AI大模型生成内容质量的装置，其特征在于，所述模型测试模块包括：</p>

8.根据权利要求6所述的提升AI大模型生成内容质量的装置，其特征在于，所述模型训练模块包括：

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现权利要求1-5任一项所述的提升AI大模型生成内容质量的方法的步骤。

10.一种计算机设备，所述计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-5任一项所述的提升AI大模型生成内容质量的方法的步骤。

...

【技术特征摘要】

1.一种提升ai大模型生成内容质量的方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的提升ai大模型生成内容质量的方法，其特征在于，所述s5步骤的对训练完成后的所述模型进行测试的方法主要包括以下步骤：

3.根据权利要求2所述的提升ai大模型生成内容质量的方法，其特征在于，所述s53步骤的评估模型的性能的评估方法包括以下一种或两种的组合：

4.根据权利要求1所述的提升ai大模型生成内容质量的方法，其特征在于，所述s4步骤的对增加提示词增强模块的模型进行训练的方法包括以下步骤：

5.根据权利要求1所述的提升ai大模型生成内容质量的方法，其特征在于，所述s1步骤的所述高质量的原始提示词及其对应的详细描述的数据的获取方式包括：从现有的ai大模型生成内容中获取，或者，通过人工撰写或编辑获得；...

【专利技术属性】
技术研发人员：司玉景，李全忠，何国涛，蒲瑶，
申请(专利权)人：普强时代珠海横琴信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人