【技术实现步骤摘要】
本申请涉及人工智能领域,具体而言,涉及一种基于大模型的知识加工、知识问答方法、装置及介质。
技术介绍
1、pdf(portable document format)作为一种通用的电子文档格式,因其跨平台性和结构稳定性而得到了广泛的应用。在现实中,有大量的数据内容都是以pdf形式存在,随着人工智能的不断发展,在客服以及信息检索领域,基于pdf文档的智能问答应用也逐渐兴起。
2、但现有的pdf文档问答系统由于对pdf无法进行精细化的解析,在解析精度上受到限制,导致只能处理一些简单的文档。针对用户的提问,还存在回答内容不全面,语序前后不连贯的问题。上述问题均会导致问答效果不佳,从而影响用户体验。
技术实现思路
1、为了解决上述问题,本申请提供一种基于大模型的知识加工、知识问答方法、装置及介质。
2、第一方面,本申请提供一种基于大模型的知识加工方法,包括:
3、获取目标文档对应的目标图片文件,其中,所述目标文档表示待解析的不可编辑格式的文档,所述目标图片文件表示
...【技术保护点】
1.一种基于大模型的知识加工方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述层级嵌套的知识片段,生成问答数据库,以使在知识问答时根据所述问答数据库获取答案,包括:
3.根据权利要求1所述的方法,其特征在于,所述获取目标文档对应的目标图片文件,包括:
4.根据权利要求3所述的方法,其特征在于,所述根据预设的分页规则,判断是否需要对所述初始图片文件中的图片进行分页,包括:
5.根据权利要求3所述的方法,其特征在于,所述根据预设的分页规则,判断是否需要对所述初始图片文件中的图片进行分页,包括:<
...【技术特征摘要】
1.一种基于大模型的知识加工方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述层级嵌套的知识片段,生成问答数据库,以使在知识问答时根据所述问答数据库获取答案,包括:
3.根据权利要求1所述的方法,其特征在于,所述获取目标文档对应的目标图片文件,包括:
4.根据权利要求3所述的方法,其特征在于,所述根据预设的分页规则,判断是否需要对所述初始图片文件中的图片进行分页,包括:
5.根据权利要求3所述的方法,其特征在于,所述根据预设的分页规则,判断是否需要对所述初始图片文件中的图片进行分页,包括:
6.根据权利要求1所述的方法,其特征在于,所述根据所述解析结果中标题对应的级别和所述正文内容,获取层级嵌套的知识片段,包括:
7.根据权利要求6所述的方法,其特征在于,所述根据所述解析结果中标题对应的级别,获取所述标题的层级结构,包括:
8.根据权利要求7所述的方法,其...
【专利技术属性】
技术研发人员:邓邱伟,张旭,付振宇,刘朝振,王淼,
申请(专利权)人:青岛海尔科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。