基于大语言模型的自然语言问答方法、装置、介质及设备制造方法及图纸

技术编号:40245328 阅读:24 留言:0更新日期:2024-02-02 22:41
本发明专利技术提供了一种基于大语言模型的自然语言问答方法、装置、介质及设备,该方法包括:获取参考知识文档;将所述参考知识文档分割成多个文本块,并对所述多个文本块进行分词及词向量表示,得到包括多个文本特征向量的向量数据库;获取用户输入的自然语言问题;对所述自然语言问题进行分词及词向量表示,得到分词向量;从向量数据库中查找与分词向量相关度大于设定阈值的目标文本特征向量;确定所述目标文本特征向量对应的目标文本块;基于大语言模型对自然语言问题和所述目标文本块进行语言处理,生成所述自然语言问题的答案。该方法能够基于大语言模型,使得自然语言问答模型更加智能,而且部署资源消耗少、回复准确率高。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其涉及一种基于大语言模型的自然语言问答方法、装置、介质及设备


技术介绍

1、目前知识库问答大多采用知识图谱技术,把信息格式化为三元组,存储到向量数据库中,当我们查询某个问题时,我们采用比较近似度方式,取出相似度最高的几个三元组,然后进行组装并返回答案。知识图谱面临着一些问题,对文档中的数据需要通过模型进行格式化,把文档中的数据处理成三元组,处理过程中可能会造成信息丢失,模型格式化效果不好,最终导致数据质量不高。因此,亟需提供一种新的自然语言问答方法,来解决上述问题。


技术实现思路

1、本专利技术的目的在于提供一种基于大语言模型的自然语言问答方法、装置、介质及设备,该方法能够基于大语言模型,使得自然语言问答模型更加智能,而且部署资源消耗少、回复准确率高。

2、第一方面,本专利技术实施例提供一种基于大语言模型的自然语言问答方法,该方法包括:获取参考知识文档;将所述参考知识文档分割成多个文本块,并对所述多个文本块进行分词及词向量表示,得到包括多个文本特征向量的向量数据库;获取本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的自然语言问答方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,将所述参考知识文档分割成多个文本块,包括:

3.根据权利要求1所述的方法,其特征在于,从向量数据库中查找与分词向量相关度大于设定阈值的目标文本特征向量,包括:

4.根据权利要求1至3任一项所述的方法,其特征在于,对所述多个文本块进行分词及词向量表示,得到包括多个文本特征向量的向量数据库,包括:

5.根据权利要求1至3任一项所述的方法,其特征在于,对所述自然语言问题进行分词及词向量表示,得到分词向量,包括:

6.一种基于大语言模...

【技术特征摘要】

1.一种基于大语言模型的自然语言问答方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,将所述参考知识文档分割成多个文本块,包括:

3.根据权利要求1所述的方法,其特征在于,从向量数据库中查找与分词向量相关度大于设定阈值的目标文本特征向量,包括:

4.根据权利要求1至3任一项所述的方法,其特征在于,对所述多个文本块进行分词及词向量表示,得到包括多个文本特征向量的向量数据库,包括:

5.根据权利要求1至3任一项所述的方法,其特征在于,对所述自然语言问题进行分词及词向量表示,得到分词向量,包括:

6.一种基于大语言模型的自然语言问答装置,其特征在于,...

【专利技术属性】
技术研发人员:董帅豪
申请(专利权)人:上海数珩信息科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1