System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种对话式检索系统技术方案_技高网
当前位置: 首页 > 专利查询>姜晓全专利>正文

一种对话式检索系统技术方案

技术编号:40499948 阅读:4 留言:0更新日期:2024-02-26 19:27
本发明专利技术属于检索系统技术领域,提供了一种对话式检索系统,包括:对话缓存服务,所述对话缓存服务用来缓存并检索语言模型生成的结果;资源检索服务,所述资源检索服务用来存储并检索真实的资源信息;本发明专利技术通过设置对话缓存服务,可以减少系统与语言模型的交互频次,降低了成本,同时可以对语言模型生成的内容进行筛选并对用户Query进行加工,从而提升缓存命中率并返回给用户更优质的结果;通过设置资源检索服务,资源检索服务将真实信息融入到对话中,提升了可信度,同时通过关键词索引限制了对话内容,增强了对话的安全性;该检索系统搭建方便,且使用的技术相对成熟,同时可以被快速迁移到不同领域中,适合大面积的推广与应用。

【技术实现步骤摘要】

本专利技术属于检索系统,具体地说是一种对话式检索系统


技术介绍

1、对话式检索系统是一种基于对话方式进行信息检索和交互的系统。它可以通过自然语言对话的方式,理解用户的意图和需求,并提供相应的回答或推荐。对话式检索系统通常使用自然语言处理(nlp)和机器学习技术来实现对话交互和信息检索的功能;

2、目前,对话检索系统在实际应用中存在计算资源消耗大,成本较高,且在对话系统中的可信度、启发性和安全性不佳,同时系统缺乏便捷性和可迁移性的问题,不适合大面积的推广与应用。

3、为此,本领域技术人员提出了一种对话式检索系统来解决
技术介绍
提出的问题。


技术实现思路

1、为了解决上述技术问题,本专利技术提供一种对话式检索系统,以解决现有技术中语言模型的检索系统在实际应用中存在计算资源消耗大,成本较高,且在对话系统中的可信度、启发性和安全性不佳,同时系统缺乏便捷性和可迁移性的问题,不适合大面积的推广与应用等问题。

2、一种对话式检索系统,包括:

3、对话缓存服务,所述对话缓存服务用来缓存并检索语言模型生成的结果;

4、资源检索服务,所述资源检索服务用来存储并检索真实的资源信息;

5、应用服务,所述应用服务用来处理用户请求和展示界面。

6、优选的,所述对话缓存服务包括提示词检索模块、对话结果缓冲模块和语言模型,系统接收用户请求后对用户的query进行加工,判断缓存中是否存在与用户意图相同或相似的结果,该服务可以降低系统与语言模型交互的频次,降低成本,同时可以更好地启发用户,返回给用户更有价值的结果。

7、优选的,所述资源检索服务包括资源检索模块和资源存储模块,系统接收用户请求后,可以在资源库中查找相关信息并返回给用户,该服务可以增强对话的可信度,同时起到了过滤对话内容的作用,保证对话的安全性。

8、一种对话式检索方法,包括以下步骤:

9、s1、接收用户请求,查询资源检索服务中是否有相关信息,如果不存在,提醒用户无法回答,反之进入对话缓存服务;

10、s2、调用对话缓存服务,查找缓存中是否存在与用户意图相关的结果,如果存在,直接返回缓存中的内容;反之,调用大语言模型生成内容并缓存;

11、s3、系统将对话缓存服务生成的结果和资源检索服务检索到的结果拼接到一起返回给用户。

12、一种基于检索系统在大语言模型缓存系统中的应用,包括:

13、缓存内容:缓存用户提交的提示语(prompt)以及由该prompt生成的内容和其他信息;

14、底层存储选用kv存储,数据结构为{“prompt”:{“content”:”xxx”,”expi re”:”xxx”,”h it”:”xxx”}},其中prompt表示提示语,content表示大语言模型生成的内容,expire表示失效时间,h it表示命中次数;

15、缓存策略:①并非所有大语言模型生成的内容都会被缓存,内容在被缓存前会通过一个内容评价算法,该算法判断prompt和生成的内容质量是否达标,如果达标则会缓存;②系统定期扫描缓存内容,对过期内容进行清理;③系统定期扫描缓存内容,对内容按照命中次数进行排序,排序较低(即很少命中)的内容进行清理,缓存策略也帮助系统过滤掉了不良内容、过期内容以及冷门内容;

16、其具体包括以下步骤:

17、s1、用户提交prompt后进行查询,查看缓存是否有相应内容,如果有则直接返回缓存中的内容;反之,调用语言模型;

18、s2、调用语言模型生成的内容首先通过一个内容评价算法,该算法对prompt和生成内容进行评估(判断内容长度和有无敏感词),对符合条件的内容进行缓存;反之,不缓存;

19、s3、系统定期扫描缓存内容,对过期内容进行清理;

20、s4、系统定期扫描缓存内容,对内容按照命中次数进行排序,排序较低(即很少命中)的内容进行清理。

21、一种基于检索系统在大语言模型可信度中的应用,包括一种利用大语言模型进行二次检索的算法,具体包括以下步骤:

22、s11、搜集相关信息(包括网页等),提取关键词并进行索引,形成一套可检索的信息库;

23、s12、系统接收用户query后,先在信息库中进行检索,若没有检索到相关信息,则认为系统无法回答用户query并提示用户;

24、s13、如果信息库中存在与用户query相关的信息,调用大语言模型生成内容;

25、s14、对用户query和语言模型生成的内容分别利用lda算法进行主题分析,形成主题关键词信息;

26、s15、将主题关键词分为两类,一类是query和生成内容相重叠关键词(一般认为这与当前对话内容存在强关联),另一类是只在生成内容中出现的关键词(一般认为与当前内容存在弱关联);

27、s16、分别检索这两组信息,将得到的结果返回给用户。

28、一种基于检索系统在大语言模型启发性、安全性和可迁移性中的应用,包括一种利用检索系统优化提示工程的方法和一种利用检索系统进行对话系统内容快速迁移的方法。

29、优选的,一种利用检索系统优化提示工程的方法,包括:

30、直接查询法:直接利用缓存系统中的检索模块对用户的query进行查询,得到缓存与用户query相同或高度相似的prompt,并把这些prompt作为加工后的结果;

31、模板加工法:如果在缓存中没有找到与用户query高度契合的prompt,则进行下列操作:

32、a、对用户query进行主题分析,得到主题关键词;

33、b、对查询到的与用户query相似度较低的prompt进行主题分析,得到主题关键词;

34、c、将prompt中的主题关键词替换成用户query中的主题关键词,作为提示工程加工后的prompt。

35、其流程具体如下:

36、①系统对缓存中的prompt进行倒排索引,形成prompt关键词倒排链表;

37、②系统对用户提交的query进行关键词提取,并检索prompt倒排链表,获取相关的prompt;

38、③如果发现与用户query相同或高度相似的prompt,直接使用该prompt替换用户query;

39、④如果发现没有与用户query高度匹配的prompt,那么对相似度较低的prompt进行关键词分析,将该prompt的关键词替换为用户query的关键词,形成最后的prompt。

40、优选的,一种利用检索系统进行对话系统内容快速迁移的方法,包括以下步骤:

41、s101、全面搜集某一领域内的信息,形成领域资源库;

42、s102、对资源库中的资源进行关键词提取,形成关键词信息库;

43、s103、当用户提交对话请求后,对用户q本文档来自技高网...

【技术保护点】

1.一种对话式检索系统,其特征在于,包括:

2.如权利要求1所述一种对话式检索系统,其特征在于:所述对话缓存服务包括提示词检索模块、对话结果缓冲模块和语言模型,系统接收用户请求后对用户的Query进行加工,判断缓存中是否存在与用户意图相同或相似的结果。

3.如权利要求1所述一种对话式检索系统,其特征在于:所述资源检索服务包括资源检索模块和资源存储模块,系统接收用户请求后,可以在资源库中查找相关信息并返回给用户。

4.一种对话式检索方法,适用于如权利要求1-3任意一项所述的一种对话式检索系统,其特征在于:包括以下步骤:

【技术特征摘要】

1.一种对话式检索系统,其特征在于,包括:

2.如权利要求1所述一种对话式检索系统,其特征在于:所述对话缓存服务包括提示词检索模块、对话结果缓冲模块和语言模型,系统接收用户请求后对用户的query进行加工,判断缓存中是否存在与用户意图相同或相似的结果。

3...

【专利技术属性】
技术研发人员:姜晓全
申请(专利权)人:姜晓全
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1