基于检索增强的空天地车联网知识问答平台、构建及问答方法技术

技术编号:46611248 阅读:0 留言:0更新日期:2025-10-14 21:09
本发明专利技术公开了一种基于检索增强的空天地车联网知识问答平台构建方法,主要解决现有知识问答平台成本大、搜寻速度与准确度低的问题。其实现方案是:获取空天地车联网行业的白皮书,行业综述,会议报告等权威文件;采集空天地车联网领域相关知识问答数据构成行业数据集并对其预处理;通过预处理后的行业数据对语言模型进行微调训练;用微调后的语言模型将数据集的问题文本转化为问题文本嵌入,再使用Faiss将其转化得到对应的索引文件、计数器文件和元数据文件,并对其进行更新;将微调模型,索引文件,元数据文件部署在RAG服务端口,用户通过指定的端口与预定义的请求格式访问并获取服务。本发明专利技术能降低用户成本,提高知识搜寻的速度与准确度,可用于行业专业知识库的搭建。

【技术实现步骤摘要】

本专利技术属于信息处理,更进一步涉及一种空天地车联网知识问答平台及构建方法,可用于用户查询文本的检索增强与生成。


技术介绍

1、检索增强与生成rag,是一种结合信息检索和文本生成的混合模型架构。其中的检索阶段负责从大量文档中找到与输入查询最相关的片段,这个检索思想在检索本地数据库中同样表现优异,faiss作为其中的关键技术在信息检索领域已渐成为一种不可或缺的极具潜力的检索工具。相比于传统的关键词匹配搜索来说,这种检索通过优化索引结构和算法,能够在大规模数据集中快速检索相似向量,显著提升检索速度;支持分布式部署和gpu加速,能够处理更大规模的数据集,并提供高效的内存管理;结合向量表示技术,能够实现语义级别的相似性搜索。

2、空天地车联网是由依托无人机、飞行器等近空平台构成的空基网络、基于星座卫星的天基网络和由地面蜂窝通信、光纤网络及路侧基础设施构成的地基网络通过跨域协同与融合架构组成的立体化通信系统。其中涉及的领域知识包含各个领域的技术架构、发展特征、应用场景与协同机理,即不同空间层次的网络架构定义及其功能定位,随着各种网络形态的演进方向与发展现本文档来自技高网...

【技术保护点】

1.一种基于检索增强的空天地车联网知识问答平台,其特征在于:包括:

2.根据权利要求1所述的平台,其特征在于:

3.根据权利要求1所述的平台,其特征在于,所述索引构建查询模块,包括:

4.一种基于检索增强的空天地车联网知识问答平台的构建方法,其特征在于,包括:

5.根据权利要求4所述的方法,其特征在于,所述2)中对行业数据集中的文本数据执行降噪、标记、标准化存储的数据预处理,其实现包括如下:

6.根据权利要求5所述的方法,其特征在于,所述3)中将预处理后的行业数据集放入MiniLM-L12语言模型中进行微调训练,其实现包括如下:...

【技术特征摘要】

1.一种基于检索增强的空天地车联网知识问答平台,其特征在于:包括:

2.根据权利要求1所述的平台,其特征在于:

3.根据权利要求1所述的平台,其特征在于,所述索引构建查询模块,包括:

4.一种基于检索增强的空天地车联网知识问答平台的构建方法,其特征在于,包括:

5.根据权利要求4所述的方法,其特征在于,所述2)中对行业数据集中的文本数据执行降噪、标记、标准化存储的数据预处理,其实现包括如下:

6.根据权利要求5所述的方法,其特征在于,所述3)中将预处理后的行业数据集放入minilm-l12语言模型...

【专利技术属性】
技术研发人员:惠一龙张帅漆启帆
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1