知识问答方法、向量数据库构建方法及装置制造方法及图纸

技术编号:40396919 阅读:119 留言:0更新日期:2024-02-20 22:24
本发明专利技术提供一种知识问答方法、向量数据库构建方法及装置,涉及人工智能技术领域,其中方法包括:将待回答问题转换为问题向量;在向量数据库中确定与问题向量匹配的目标信息块向量,所述向量数据库中存储有至少一个信息块向量;所述信息块向量是基于文档块确定的;所述文档块为基于事件完整性对文档进行划分得到的,确定所述目标信息块向量对应的目标文档块;基于目标文档块确定待回答问题对应的目标知识;输出目标知识。由于本发明专利技术的文档块是基于事件完整性对文档进行划分得到的,所以确定的目标信息块向量对应的目标文档块能够完整的表达一个事件,使得得到的待回答问题的关联信息更加完整,从而能够提高知识问答的准确性。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其涉及一种知识问答方法、向量数据库构建方法及装置


技术介绍

1、随着大语言模型在通用领域的自然语言理解和推理方面的能力有了质的飞跃后,越来越多的领域开始基于大语言模型探索垂直领域的问答应用。

2、相关技术中,通常将特定领域的文档按照标点符号分割为多个信息块,将信息块转换为信息块向量,再将信息块和信息块向量对应存储在向量数据库中;在获取到用户输入的提问问题时,将提问问题转换为问题向量,在向量数据库中查找与问题向量匹配的信息块向量,以匹配的信息块向量对应的信息块为中心,基于预设长度阈值将该信息块相邻的信息和该信息块共同作为提问问题的关联信息,进而基于关联信息确定提问问题对应的答案。

3、但上述相关技术中,向量数据库中存储的信息块是基于标点符号进行分割得到的,若基于预设长度阈值确定提问问题的关联信息,会导致得到的关联信息不完整,从而降低了知识回答的准确性。


技术实现思路

1、针对现有技术存在的问题,本专利技术实施例提供一种知识问答方法、向量数据库构建方法及装置。<本文档来自技高网...

【技术保护点】

1.一种知识问答方法,其特征在于,包括:

2.根据权利要求1所述的知识问答方法,其特征在于,所述向量数据库中还存储有各所述信息块向量所属文档块的标识;

3.根据权利要求2所述的知识问答方法,其特征在于,所述方法还包括:

4.根据权利要求2所述的知识问答方法,其特征在于,所述方法还包括:

5.根据权利要求1-4任一项所述的知识问答方法,其特征在于,所述基于所述目标文档块确定所述待回答问题对应的目标知识,包括:

6.根据权利要求3所述的知识问答方法,其特征在于,所述在向量数据库中确定与所述问题向量匹配的目标信息块向量,包括:

...

【技术特征摘要】

1.一种知识问答方法,其特征在于,包括:

2.根据权利要求1所述的知识问答方法,其特征在于,所述向量数据库中还存储有各所述信息块向量所属文档块的标识;

3.根据权利要求2所述的知识问答方法,其特征在于,所述方法还包括:

4.根据权利要求2所述的知识问答方法,其特征在于,所述方法还包括:

5.根据权利要求1-4任一项所述的知识问答方法,其特征在于,所述基于所述目标文档块确定所述待回答问题对应的目标知识,包括:

6.根据权利要求3所述的知识问答方法,其特征在于,所述在向量数据库中确定与所述问题向量匹配的目标信息块向量,包括:

7.根据权利要求1-4任一项所述的知识问答方法,其特征在于,所述将待回答问题转换为问题向量,包括:

8.一种向量数据库构建方法,其特征在...

【专利技术属性】
技术研发人员:陈祚松谭学士李云龙李洪亮
申请(专利权)人:奇安信科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1