一种面向电网数字化建设成果资源的智能检索方法及系统技术方案

技术编号:36777633 阅读:25 留言:0更新日期:2023-03-08 22:05
本发明专利技术公开了一种面向电网数字化建设成果资源的智能检索方法及系统,包括:获取检索词句;将检索词句输入到训练好的基于分词模型和电网数字化建设成果知识图谱的深度网络联合模型,在深度网络联合模型中基于分词模型将检索词句进行分词处理得到语义特征,电网数字化建设成果知识图谱将语义特征经过深度网络推理得到赋予不同权重排序后的匹配结果;将匹配结果作为搜索结果输出。优点:将电网数字化建设成果这种非结构化的信息使用知识图谱关联建模,构建结构化的电网数字化建设成果知识图谱,能给业务人员提供更准确高效的搜索体验,能形成与检索关键词相关的业务数据展示,有效降低电网数字化建设成果资源的开放成本。有效降低电网数字化建设成果资源的开放成本。有效降低电网数字化建设成果资源的开放成本。

【技术实现步骤摘要】
一种面向电网数字化建设成果资源的智能检索方法及系统


[0001]本专利技术涉及一种面向电网数字化建设成果资源的智能检索方法及系统,属于自然语言处理


技术介绍

[0002]电网公司为了展示数字化建设成果全貌,将分散在云平台、数据中台、业务中台、技术中台等建设的基础设施、数据资源、共享服务、数据模型、算法模型、数字化应用、知识案例等数字化成果进行全量汇聚,设计科学的分级分类体系,形成统一服务窗口,已经接入了 TB 级的成果数量,但是这些数字化成果是非结构化的,以文档、视频等各种形式存在,基层业务人员难以准确搜索到成果并加以利用,传统的检索方式采用词语相似匹配度,业务人员使用传统检索方式查找所需成果存在“查询慢”、“获取难”的困局,导致各专业、部门的业务人员对数字化建设成果的学习成果较高。
[0003]随着人工智能领域的发展,深度网络逐步发挥更大的作用,知识图谱就是深度网络的一种表征形式,知识图谱以三元组形式存储实体的属性和关系,可以理解为一张由知识点相互连接而成的语义深度网络,可以用来更好的查询非结构化信息。例如申请号为CN 20本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种面向电网数字化建设成果资源的智能检索方法,其特征在于,包括:获取检索词句;将检索词句输入到训练好的基于分词模型和电网数字化建设成果知识图谱的深度网络联合模型,在深度网络联合模型中基于分词模型将检索词句进行分词处理得到语义特征,电网数字化建设成果知识图谱将语义特征经过深度网络推理得到赋予不同权重排序后的匹配结果;将匹配结果作为搜索结果输出。2.根据权利要求1所述的面向电网数字化建设成果资源的智能检索方法,其特征在于,所述基于分词模型和电网数字化建设成果知识图谱的深度网络联合模型的训练,包括:所述分词模型采用BERT中文自然语言处理模型;获取GCN预训练模型;利用构建的电网数字化建设成果知识图谱数据集对BERT中文自然语言处理预训练模型与GCN预训练模型进行联合网络训练直至收敛,得到训练好的基于分词模型和电网数字化建设成果知识图谱的深度网络联合模型。3.根据权利要求2所述的面向电网数字化建设成果资源的智能检索方法,其特征在于,所述电网数字化建设成果数据集的构建,包括:根据业务需求梳理检索场景,收集检索案例;以检索对应的成果本体对象为中心,确定中心与其他关联属性的拓扑结构,再与其他相关数据进行关联,形成以成果本体为核心、其他相关属性为枝叶的电网数字化建设成果知识图谱数据集。4.根据权利要求2所述的面向电网数字化建设成果资源的智能检索方法,其特征在于,所述利用构建的电网数字化建设成果知识图谱数据集对BERT中文...

【专利技术属性】
技术研发人员:钱天成孙立华刘士进丁红雨刘铭陆传荣张杨
申请(专利权)人:南京南瑞信息通信科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1