一种prompt推荐方法及模块技术

技术编号：40061716 阅读：11 留言：0更新日期：2024-01-16 22:47

本发明专利技术公开一种prompt推荐方法，提供大模型模块和prompt推荐模块，由用户对话输入prompt，如果大模型模块的答案不符合用户的要求时，且用户决定调用prompt推荐模块生成多个新prompt，进而用户从多个新的prompt选择合适的prompt，以让大模型重新生成答案，直至大模型生成的答案符合用户的期望，然后结束并进入下一轮对话，如用户决定不调用prompt推荐模块，则结束并进入下一轮对话；如果答案符合用户的要求时，则直接结束并进入下一轮对话。经本申请实现这些候选的prompt在一定程度上能够保证得到高质量的模型响应，无需要调用大模型，响应速度快，调用模型的成本能够大大降低，且与大模型交互的质量大大提高。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能领域，特别是涉及一种prompt推荐方法及模块。

技术介绍

1、在人工智能领域中，提示工程是创建提示、要求或指示的过程，用来引导chatgpt等语言模型的输出。它允许用户控制模型的输出，生成符合他们特定需求的文本。chatgpt是一种性能优良的语言模型，能够生成类似人类的文本。它建立在transformer架构上，这使它能够处理大量的数据并生成高质量的文本。

2、为了从chatgpt获得最好的结果，了解如何正确使用提示模型是很重要的。提示允许用户控制模型的输出，生成相关、准确和高质量的文本。在使用chatgpt时，了解它的能力和限制是很重要的。该模型能够生成类似人类的文本，但如果没有适当的引导，它输出的内容可能不是我们所期望的。

3、为了使得输入的问题可以很好的被大模型理解并给出符合预期的答案，便出现了提示工程技术：通过提供清晰而具体的说明，您可以指导模型输出，确保它是相关的。它一般由三个要素组成：任务、说明和角色。任务是对模型生成内容的清晰、简洁的陈述；说明是模型生成文本时应遵循的指令；角色是模型在生成文本时应承担的角色。其提供了关于prompt的生成方法，第一种是给出了一种标准，要求我们写的prompt符合其标准，则语言模型将会生成较好的回答。但是该方法没有对具体的任务提供具体的prompt参考，还是需要用户去理解并写出自己的prompt，且也并不确定生成的答案质量一定高。

4、另一种解决提示问题的是ape(automatic prompt engineer)，该方案

技术实现思路

1、本专利技术的目的是提供一种prompt推荐方法及模块，解决现有技术问题，帮助用户更好的与大模型进行交流，使得用户问的问题，模型能够更加理解，与做出更好的回答。

2、为实现上述技术目的，本专利技术提供一种prompt推荐方法，首先，提供大模型模块和prompt推荐模块；然后，由用户与所述大模型模块进行对话并输入prompt，所述大模型生成作为模型响应的答案，判断得到的所述答案是否符合所述用户的要求：如果所述答案不符合所述用户的要求时，且所述用户决定调用所述prompt推荐模块生成多个新prompt，进而所述用户从多个所述新的prompt选择合适的prompt，以让所述大模型重新生成答案，直至所述大模型生成的答案符合所述用户的期望，然后结束并进入下一轮对话，如所述用户决定不调用所述prompt推荐模块，则结束并进入下一轮对话；如果所述答案符合所述用户的要求时，则直接结束并进入下一轮对话。

3、本专利技术提供一种prompt推荐方法，旨在帮助用户更好的与大模型进行交流，使得用户问的问题，模型能够更加理解，与做出更好的回答，其根据用户的输入的较差响应的prompt，生成推荐的候选的prompt，这些候选的prompt在一定程度上能够保证得到高质量的模型响应。该推荐方法不需要调用大模型，响应速度快，调用模型的成本能够大大降低，且与大模型交互的质量大大提高。

4、作为进一步的改进，所述大模型模块为用户使用的大模型聊天工具，所述prompt推荐模块包括：所述大模型聊天工具的用户历史数据的收集与存储模块，以及prompt的召回与推荐模块。

5、作为进一步的改进，所述收集与存储模块收集所述用户在所述大模型模块上进行聊天获取的交互数据，并将收集的数据转化成相应的形式进行存储，所述收集与存储模块包含如下功能和操作处理：向量数据库的选择、文本的向量转化、用户输入的prompt模版抽取、意图点的识别、向量数据库的存储；所述prompt的召回与推荐模块将待优化的用户问题转化成一些优化后的用户问题供给用户挑选，这些优化后的问题使得模型产生高质量的回答，所述prompt的召回与推荐模块包含如下功能和操作处理：大模型的接口调用、向量数据库的检索召回、意图点识别、模块与意图的重新组合。

6、作为进一步的改进，所述收集与存储模块由以下步骤组成：s1：所述用户将自己的意图表达成文字进行输入，该输入将进入到聊天产品；s2：聊天产品后台会调用大模型进行响应并以数据流的形式输出；s3：用户评价分数挖掘；s4：对问答对数据进行筛选；s5：高质量问答对的存储。

7、作为进一步的改进，所述s3中用户评价分数挖掘，所述聊天产品具有多名用户进行参与并对所述大模型回答较好的回复进行打分和进行质量评价，以获得整个用户的评分数；所述s4中对问答对数据进行筛选为：若问答对的评价分数高，则被筛选出来，若评价的分数较低，则进行过滤；所述s5中高质量问答对的存储经过两个方法进行：方法1：将问答对中的问题部分转化成向量，向量转化方法采用doc2vec的方法或采用预训练的接口输出其对应的文本向量，然后将问答对及问题对应的向量存入向量数据库；方法2：分别将问答对中的问题进行模版的抽取，进行意图点的识别，将提取的意图点转化成向量后，将意图点、模板、原问答对以及向量进行存储。

8、作为进一步的改进，所述s3中，所述质量评价包括：点赞、踩、或维度上的量化评分，所述维度包括：启发性、流畅性、有帮助性、真实性、有害性；整个用户的评分公式如下：

9、

10、其中up_cnt表示点赞次数，down_cnt表示踩次数，enlight_score表示启发性分数，fluency_score表示流畅度分数，helpful_score表示有帮助性分数，truthful_score表示真实性分数，harmful_score表示有害性分数，w1,w2,w3,w4,w5,w6,分别表示各个特征之间的权重，这个分数一般为0-1之间且之和等于1。

11、作为进一步的改进，所述s4中，所述过滤的逻辑有两种：第一种是对于各种指标分别设定相应的阈值，第二种是将各种指标通过加权求和的方式，计算出一个总的分数，然后对这一个分数设定相应的阈值。

12、作为进一步的改进，在所述评分公式中：w1＝0.25,w2＝0.15,w3＝0.10,w4＝0.10,w5＝0.15,w6＝0.25，根据所述评分公式计算出的评价总分设定的所述阈值为threshold_value＝0.75，若大于这个值，则被筛选出来，若小于这个值，则过滤。

13、作为进一步的改进，所述质量评价通过对话的统计指标进行隐性挖掘出，所述统计指标包括：参与对话的用户数、浏览对话的次数本文档来自技高网...

【技术保护点】

1.一种prompt推荐方法，其特征在于：

2.根据权利要求1所述的一种prompt推荐方法，其特征在于：所述大模型模块为用户使用的大模型聊天工具，所述prompt推荐模块包括：所述大模型聊天工具的用户历史数据的收集与存储模块，以及prompt的召回与推荐模块。

3.根据权利要求2所述的一种prompt推荐方法，其特征在于：

4.根据权利要求3所述的一种prompt推荐方法，其特征在于：所述收集与存储模块由以下步骤组成：

5.根据权利要求4所述的一种prompt推荐方法，其特征在于：

6.根据权利要求5所述的一种prompt推荐方法，其特征在于：所述S3中，所述质量评价包括：点赞、踩、或维度上的量化评分，所述维度包括：启发性、流畅性、有帮助性、真实性、有害性；

7.根据权利要求6所述的一种prompt推荐方法，其特征在于：所述S4中，所述过滤的逻辑有两种：第一种是对于各种指标分别设定相应的阈值，第二种是将各种指标通过加权求和的方式，计算出一个总的分数，然后对这一个分数设定相应的阈值。

8.根据权利

9.根据权利要求5所述的一种prompt推荐方法，其特征在于：所述质量评价通过对话的统计指标进行隐性挖掘出，所述统计指标包括：参与对话的用户数、浏览对话的次数、该对话的问答对个数、评论次数、点赞次，并根据所述统计指标设计该问题的质量评价分数；所述打分包括：1分表示较差，2分表示一般，3分表示中等，4分表示较好，5分表示很好，或者1分表示差，2分表示较差，3分表示一般，4分表示较好，5分表示很好。

10.根据权利要求3所述的一种prompt推荐方法，其特征在于：所述prompt的召回与推荐模块由以下步骤组成：

11.根据权利要求3所述的一种prompt推荐方法，其特征在于：所述向量数据库的选择为采用Milvus，所述文本的向量转化为采用大模型接口调用的方式将文本转化成向量，所述用户输入的模板抽取为采用：命名实体识别的方法，或者调用大模型接口方法，所述意图点的识别为采用：命名实体识别的方法，或者调用大模型接口方法。

12.根据权利要求3所述的一种prompt推荐方法，其特征在于：所述向量数据库的检索召回是根据两个向量之间的相似性，召回方法包括以下一种或几种：

13.根据权利要求12所述的一种prompt推荐方法，其特征在于：所述召回方法根据具体的应用场景和性能需求进行选择。

14.根据权利要求13所述的一种prompt推荐方法，其特征在于：所述具体的应用场景和性能需求包括：高维向量空间的召回，以及大规模向量库的高效召回。

15.根据权利要求3所述的一种prompt推荐方法，其特征在于：所述模板与意图点的重新组合调用大模型接口，其中prompt的写法为提供一个意图点、三个模板并请求一个合适的模板拼成一个问题，所述大模型响应的答案为拼成一个合适的问题。

16.一种prompt推荐模块，由用户与大模型模块进行对话并输入prompt，所述大模型生成作为模型响应的答案，其特征在于：

...

【技术特征摘要】

1.一种prompt推荐方法，其特征在于：

3.根据权利要求2所述的一种prompt推荐方法，其特征在于：

4.根据权利要求3所述的一种prompt推荐方法，其特征在于：所述收集与存储模块由以下步骤组成：

5.根据权利要求4所述的一种prompt推荐方法，其特征在于：

6.根据权利要求5所述的一种prompt推荐方法，其特征在于：所述s3中，所述质量评价包括：点赞、踩、或维度上的量化评分，所述维度包括：启发性、流畅性、有帮助性、真实性、有害性；

7.根据权利要求6所述的一种prompt推荐方法，其特征在于：所述s4中，所述过滤的逻辑有两种：第一种是对于各种指标分别设定相应的阈值，第二种是将各种指标通过加权求和的方式，计算出一个总的分数，然后对这一个分数设定相应的阈值。

8.根据权利要求7所述的一种prompt推荐方法，其特征在于：在所述评分公式中：w1＝0.25,w2＝0.15,w3＝0.10,w4＝0.10,w5＝0.15,w6＝0.25，根据所述评分公式计算出的评价总分设定的所述阈值为threshold_value＝0.75，若大于这个值，则被筛选出来，若小于这个值，则过滤。

9.根据权利要求5所述的一种prompt推荐方法，其特征在于：所述质量评价通过对话的统计指标进行隐性挖掘出，所述统计指标包括：参与对话的用户数、浏览对话的次数、该对话的问答对个数、评论...

【专利技术属性】
技术研发人员：明道东，姜迅，张华，臧雨晨，单伟，吴义明，赵涵，连明杰，
申请(专利权)人：短歌有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人