【技术实现步骤摘要】
本申请涉及电数字数据处理领域,尤其涉及一种基于大语言模型的电力行业动态知识库构建方法和系统。
技术介绍
1、随着电力行业信息化建设的深入推进,电力企业积累了大量包含设备参数、技术标准、运维手册等多样化文档资料。这些文档承载着重要的专业知识,对保障电力系统安全稳定运行、提升运维效率具有重要价值。建立完善的电力行业知识库,实现文档资料的高效管理和知识复用,已成为行业发展的重要需求。
2、在相关技术中,电力行业知识库采用智能文档处理系统进行建设。这类系统运用深度学习模型进行文档解析,可识别文本、表格、图形等多种格式内容。系统采用图数据库存储文档间的关联关系,建立多维度的知识索引。在知识组织方面,系统通过自然语言处理技术对文档内容进行主题聚类和标签提取,实现文档的自动分类。检索时,系统结合向量检索和关键词匹配双重机制,通过语义相似度计算筛选相关文档。知识更新采用半自动化方式,系统自动提取新文档中的关键信息,经专家审核后更新至知识库。
3、然而,由于电力领域的专业文档往往包含大量图表混排、专业术语和多层次逻辑关系,系统在进
...【技术保护点】
1.一种基于大语言模型的电力行业动态知识库构建方法,其特征在于,应用于数据处理系统,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述接收用户导入的电力领域文档,转换所述电力领域文档为包含文档唯一标识的电子文档的步骤,具体包括:
3.根据权利要求1所述的方法,其特征在于,在所述调用大语言模型解析所述电子文档,提取所述电子文档中的专业术语定义、图表位置信息和文档逻辑层次,生成包含多个上下文的知识单元的步骤之前,所述方法还包括:
4.根据权利要求1所述的方法,其特征在于,所述提取所述目标知识主题中对应的目标知识单元,基于所述
...【技术特征摘要】
1.一种基于大语言模型的电力行业动态知识库构建方法,其特征在于,应用于数据处理系统,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述接收用户导入的电力领域文档,转换所述电力领域文档为包含文档唯一标识的电子文档的步骤,具体包括:
3.根据权利要求1所述的方法,其特征在于,在所述调用大语言模型解析所述电子文档,提取所述电子文档中的专业术语定义、图表位置信息和文档逻辑层次,生成包含多个上下文的知识单元的步骤之前,所述方法还包括:
4.根据权利要求1所述的方法,其特征在于,所述提取所述目标知识主题中对应的目标知识单元,基于所述目标知识单元的目标上下文生成知识检索结果的步骤,具体包括:
5.根据权利要求4所述的方法,其特征在于,所述根据所述目标上下文,提取目标位置的图形内容和表格内容,生成多模态知识序列的步骤,具体包括:
6.根据权利要求1所述的方法,其特征在于,在所述连接所述知识单...
【专利技术属性】
技术研发人员:王迎旭,沈佐航,邵凯田,丁一帆,邵建勇,冯山,
申请(专利权)人:智明日新南京人工智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。