基于大模型的知识加工、知识问答方法、装置及介质制造方法及图纸

技术编号：40740632 阅读：15 留言：0更新日期：2024-03-25 20:00

本申请公开了一种基于大模型的知识加工、知识问答方法、装置及介质，涉及人工智能领域，该方法包括：获取目标文档对应的目标图片文件；对所述目标图片文件进行解析，获取解析结果，所述解析用于指示对所述目标图片文件中的每一张图片的元素进行提取；根据所述解析结果中标题对应的级别和所述正文内容，获取层级嵌套的知识片段，其中，每个标题对应一个级别，下一级标题为上一级标题的子标题，每个标题对应的知识片段包括本标题对应的正文内容和下一级标题的知识片段；根据层级嵌套的知识片段，生成问答数据库，以使在知识问答时根据问答数据库获取答案。该方法实现了知识加工的高可靠性和拓展性，从而达到提升回答内容的质量，增强了用户体验。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能领域，具体而言，涉及一种基于大模型的知识加工、知识问答方法、装置及介质。

技术介绍

1、pdf（portable document format）作为一种通用的电子文档格式，因其跨平台性和结构稳定性而得到了广泛的应用。在现实中，有大量的数据内容都是以pdf形式存在，随着人工智能的不断发展，在客服以及信息检索领域，基于pdf文档的智能问答应用也逐渐兴起。

2、但现有的pdf文档问答系统由于对pdf无法进行精细化的解析，在解析精度上受到限制，导致只能处理一些简单的文档。针对用户的提问，还存在回答内容不全面，语序前后不连贯的问题。上述问题均会导致问答效果不佳，从而影响用户体验。

技术实现思路

1、为了解决上述问题，本申请提供一种基于大模型的知识加工、知识问答方法、装置及介质。

2、第一方面，本申请提供一种基于大模型的知识加工方法，包括：

3、获取目标文档对应的目标图片文件，其中，所述目标文档表示待解析的不可编辑格式的文档，所述目标图片文件表示...

【技术保护点】

1.一种基于大模型的知识加工方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述层级嵌套的知识片段，生成问答数据库，以使在知识问答时根据所述问答数据库获取答案，包括：

3.根据权利要求1所述的方法，其特征在于，所述获取目标文档对应的目标图片文件，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据预设的分页规则，判断是否需要对所述初始图片文件中的图片进行分页，包括：

5.根据权利要求3所述的方法，其特征在于，所述根据预设的分页规则，判断是否需要对所述初始图片文件中的图片进行分页，包括：</p>

6.根据...

【技术特征摘要】

1.一种基于大模型的知识加工方法，其特征在于，包括：

3.根据权利要求1所述的方法，其特征在于，所述获取目标文档对应的目标图片文件，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据预设的分页规则，判断是否需要对所述初始图片文件中的图片进行分页，包括：

5.根据权利要求3所述的方法，其特征在于，所述根据预设的分页规则，判断是否需要对所述初始图片文件中的图片进行分页，包括：

6.根据权利要求1所述的方法，其特征在于，所述根据所述解析结果中标题对应的级别和所述正文内容，获取层级嵌套的知识片段，包括：

7.根据权利要求6所述的方法，其特征在于，所述根据所述解析结果中标题对应的级别，获取所述标题的层级结构，包括：

8.根据权利要求7所述的方法，其...

【专利技术属性】
技术研发人员：邓邱伟，张旭，付振宇，刘朝振，王淼，
申请(专利权)人：青岛海尔科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人