一种检索增强方法、装置、电子设备及存储介质制造方法及图纸

技术编号:41770288 阅读:27 留言:0更新日期:2024-06-21 21:47
本发明专利技术公开了一种检索增强方法、装置、电子设备及存储介质。包括对知识库中的文件进行语料提取,并提取文件中的关键信息并识别元数据;对提取的语料进行文本切割得到文本块;对文本块进行向量化处理得到低维向量索引,基于元数据与低维向量索引合并生成多维向量索引并存储到向量数据库中;对用户问题进行向量化处理后在所述向量数据库中进行查找确定出多个候选文本语料;对候选文本语料和用户问题进行预设处理后结合历史会话文本生成提示词,所述预设处理包括通过融合排名算法从候选文本语料中提取权重高的候选文本语料,压缩无关内容;将提示词输入大模型输出查询内容,对查询内容进行归纳推理后生成检索结果。该方法能够提高知识查找的准确性。

【技术实现步骤摘要】

本专利技术实施例涉及知识问答,尤其涉及一种检索增强方法、装置、电子设备及存储介质


技术介绍

1、工程行业存在品类繁多、内容复杂、专业性高的各类知识文件,包括:行业规范、企业规范、设计规格书、报告、工程来往文函、工程质量安全技术资料,历史项目资料等。

2、传统知识库一般采用大语言模型来进行问题搜索,通过大规模的预训练来学习文本数据中的模式和特征,从而具备强大的文本生成和理解能力,在自然语言处理任务中表现出色,然而在工程咨询、工程设计、工程管理等垂直领域,企业往往自建知识库,储存企业沉淀的知识、技术资料、历史项目资料等,通用大语言模型由于没有针对该垂直领域进行学习,回答时缺乏依据,无法基于知识库进行精准回答。


技术实现思路

1、本专利技术提供了一种检索增强方法、装置、电子设备及存储介质,以解决现有技术通过大语言模型进行查找无法基于知识库进行精准回答的问题。

2、根据本专利技术的一方面,提供了一种检索增强方法,包括:

3、通过数据连接器对知识库中的文件进行语料提取,通过元数据识本文档来自技高网...

【技术保护点】

1.一种检索增强方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特在于,通过切块分割器对提取的语料进行文本切割得到至少一个文本块,包括:

3.根据权利要求2所述的方法,其特征在于,所述页面文本块集合、所述段落文本块集合以及所述句子文本块集合均包括以下内容:

4.根据权利要求1所述的方法,其特征在于,所述通过结果合成器对所述候选文本语料和用户问题进行预设处理后结合历史会话文本生成提示词,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据用户问题,通过融合排名算法从所述候选文本语料中提取权重高的候选文本语料,压缩无关内...

【技术特征摘要】

1.一种检索增强方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特在于,通过切块分割器对提取的语料进行文本切割得到至少一个文本块,包括:

3.根据权利要求2所述的方法,其特征在于,所述页面文本块集合、所述段落文本块集合以及所述句子文本块集合均包括以下内容:

4.根据权利要求1所述的方法,其特征在于,所述通过结果合成器对所述候选文本语料和用户问题进行预设处理后结合历史会话文本生成提示词,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据用户问题,通过融合排名算法从...

【专利技术属性】
技术研发人员:孔晶左智黄杰
申请(专利权)人:上海普华科技发展股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1