一种基于RAG的垂直领域知识多轮问答方法技术

技术编号:43369701 阅读:23 留言:0更新日期:2024-11-19 17:50
本发明专利技术属于人工智能技术领域,且公开了一种基于RAG的垂直领域知识多轮问答方法,以知识库中的文档进行重构,并构建稠密和稀疏的向量数据库,作为基础,辅助对客户原始问题进行理解与拓展,并实现问题的有效处理,利用混合查询从向量数据库中检索得到多个文档小块及元数据信息,并利用重排模型对文档小块进行排序,对相关性排序后的文档小块进行去重和合并处理。通过以上方法,使得垂直领域中的专业复杂问题得到有效的语义拆分和层级关联,提高了检索时问题相关语义的检索成功率、原文引用的精确率和召回率,同时也有效避免了历史对话混杂无用信息、文档块内容过长淹没用户真实意图等问题,能实现高效的垂直领域知识多轮问答。

【技术实现步骤摘要】

本专利技术属于人工智能,具体为一种基于rag的垂直领域知识多轮问答方法。


技术介绍

1、垂直领域的专业问答是人工智能领域走向落地的重要场景,传统的基于文档知识库或知识图谱的问答系统主要存在以下问题;1、无法很好地理解用户问题的上下文,特别是在多轮问答中,系统难以维持对话的连贯性;2、对于需要综合多个知识点或需要推理和分析的问题,难以提供满意的答案;3、在处理非标准化或开放式问题时缺乏灵活性,难以适应不同的提问方式等。

2、随着生成式大语言模型(large language mode l,llm)的广泛使用,基于检索增强生成(retr i eva l augmented generat i on,rag)的垂直领域问答系统在一定程度上解决了上述问题,但仍可能存在复杂问题未拆解导致检索准确性不高、遗漏重要语义信息、检索到的文档块丢失重要语义和阅读顺序、文档块不包含答案造成内容、历史对话混杂无用信息、文档块内容过长淹没用户真实意图等问题,导致对话系统性能不够理想。


技术实现思路

1、本专利技术的目的在于本文档来自技高网...

【技术保护点】

1.一种基于RAG的垂直领域知识多轮问答方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种基于RAG的垂直领域知识多轮问答方法,其特征在于:步骤S1中的详细步骤为:

3.根据权利要求1所述的一种基于RAG的垂直领域知识多轮问答方法,其特征在于:步骤S2中的详细内容为:

4.根据权利要求1所述的一种基于RAG的垂直领域知识多轮问答方法,其特征在于:步骤S4中的所述混合查询为通过使用处理后问题的稠密向量去向量数据库稠密向量列查询,同时使用稀疏向量去向量数据库的稀疏向量列查询,利用倒数排名融合算法对稀疏检索和稠密检索的结果进行合并。

...

【技术特征摘要】

1.一种基于rag的垂直领域知识多轮问答方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种基于rag的垂直领域知识多轮问答方法,其特征在于:步骤s1中的详细步骤为:

3.根据权利要求1所述的一种基于rag的垂直领域知识多轮问答方法,其特征在于:步骤s2中的详细内容为:

4.根据权利要求1所述的一种基于rag的垂直领域知识多轮问答方法,其特征在于:步骤s4中的所述混合查询为通过使用处理后问题的稠密向量去向量数据库稠密向量列查询,同时使用稀疏向量去向量数据库的稀疏向量列查询,利用倒数排名融合算法对稀疏检索和稠密检索的结果进行合并。

5.根据权利要求1所述的一种基于rag的垂直领域知识多轮问...

【专利技术属性】
技术研发人员:张旭付思超程耿董博雅何麒周东甘一夫刘璇冯建明
申请(专利权)人:凝动万生医疗科技武汉有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1