问答方法、电子设备、存储介质及程序产品技术

技术编号：41059410 阅读：2 留言：0更新日期：2024-04-24 11:10

本公开提供了一种问答方法、电子设备、存储介质及程序产品。本公开的问答方法包括：接收用户输入的问题并在终端进行显示；根据用户输入的问题在终端显示问题的答案，答案为基于预先建立的知识库搜索并经由大模型生成得到；预先建立知识库的步骤包括：对提取的第一文档集进行解析或转换处理，得到目标文档集，其中目标文档集包括目标文本信息、目标图片信息和目标表格信息；建立目标文档集的知识库。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及数据融合，本公开尤其涉及一种问答方法、电子设备、存储介质及程序产品。

技术介绍

1、以chatgpt为代表的llm(large language model)为通用人工智能(agi)的发展提供了新的方向，llm通过海量的公开数据，如互联网、书籍等语料进行大规模自监督训练，获得了强大的语言理解、语言生成、推理等能力。然而，大模型对于私域数据的利用仍然面临一些挑战。私域数据是指由特定企业或个人所拥有的数据，通常包含了领域特定的知识。将大模型与私域数据进行结合，将会发挥巨大价值。私域数据从数据形态上又可以分为非结构化与结构化数据。对于非结构化数据，例如文档，通常通过检索的方式进行增强，以快速实现问答。通过检索知识库，大语言模型可以回答其本身能力之外的专业问题，使得大语言模型支持的问题边界扩大。这种方式和引入专业数据的微调方法对比，无需重新训练就可以部署一个专业领域大语言模型。

2、当前基于llm的问答装置基本上都是以文本形式的问答为主，然而在实际应用中，问答信息不止只有文本一种表达形式，还包括图片以及表格的形式。这对于问答装置的直观性、丰富性等方面提出了更高的要求。

3、但是当前基于文本的llm问答装置存在以下问题：无法满足用户多模态的信息查询。对用户的回答展示方式只有文本一种单一形式，缺少多种模态更为丰富的展示形式。

技术实现思路

1、本公开提供了一种问答方法、电子设备、存储介质及程序产品。

2、一方面，提供了一种问答方法，包括：

<...

【技术特征摘要】

1.一种问答方法，其特征在于，包括：

2.根据权利要求1所述的问答方法，其特征在于，建立所述目标文档集的知识库，包括：

3.根据权利要求1或2所述的问答方法，其特征在于，建立所述目标文档集的知识库，包括：

4.根据权利要求1或2所述的问答方法，其特征在于，对提取的第一文档集进行解析或转换处理，得到目标文本信息，包括：

5.根据权利要求1所述的问答方法，其特征在于，对提取的第一文档集进行解析或转换处理，得到目标图片信息，包括：

6.根据权利要求5所述的问答方法，其特征在于，其中，所述结构...

【专利技术属性】
技术研发人员：赵竹珺，李志飞，
申请(专利权)人：出门问问创新科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人