一种基于知识图谱的工程技经知识检索平台及其方法技术

技术编号:26376627 阅读:22 留言:0更新日期:2020-11-19 23:45
本发明专利技术涉及一种基于知识图谱的工程技经知识检索平台及其方法,其中,检索平台包括技经本体知识库、语义处理单元以及交互单元,技经本体知识库、交互单元分别与语义处理单元相互连接,技经本体知识库用于存储项目管理知识、技经知识、造价知识、工程技术知识、法规知识以及实际案例;语义处理单元根据用户输入的检索语句,生成对应的检索式,以从技经本体知识库中检索得到相关知识图谱;交互单元用于用户进行检索语句的输入操作,以及将检索得到的相关知识图谱可视化呈现给用户。与现有技术相比,本发明专利技术通过构建技经本体知识库,结合语义检索,能够使用户准确快速地检索得到所需知识,有利于提高工程专业协作效率。

【技术实现步骤摘要】
一种基于知识图谱的工程技经知识检索平台及其方法
本专利技术涉及智能检索
,尤其是涉及一种基于知识图谱的工程技经知识检索平台及其方法。
技术介绍
输变电工程作为电力系统重要基础设施,具有综合性强、协作性高等特点。输变电工程推进过程中涉及专业繁多,需不同专业间的分工与协作。但在输变电工程中,大部分技经人员精通自身专业知识,却对其他领域知识了解甚少,该情况将限制工程中专业协作效率的提高。同时,项目参与者也缺乏有效的跨行业知识学习途径,互联网上的知识往往碎片化且不够准确,课堂学习的可行性也不高。系统知识框架的缺失使得相关人员不能有针对性地选择学习内容,容易打击其积极性,最终降低学习的成效。随着我国电力行业的发展,完工的输变电工程数量不断增加,累积了大量的工程数据,但由于缺少切实可行的数据存储架构,导致项目人员无法准确快速获取所需数据,需要耗费大量的时间用于资料查找与阅读。
技术实现思路
本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种基于知识图谱的工程技经知识检索平台及其方法,以实现兼顾系统学习和语义化快速检索的目的,从而使工程参与人员能够快速准确检索得到相关知识。本专利技术的目的可以通过以下技术方案来实现:一种基于知识图谱的工程技经知识检索平台,包括技经本体知识库、语义处理单元以及交互单元,所述技经本体知识库、交互单元分别与语义处理单元相互连接,所述技经本体知识库用于存储项目管理知识、技经知识、造价知识、工程技术知识、法规知识以及实际案例;所述语义处理单元根据用户输入的检索语句,生成对应的检索式,以从技经本体知识库中检索得到相关知识图谱;所述交互单元用于用户进行检索语句的输入操作,以及将检索得到的相关知识图谱可视化呈现给用户。进一步地,所述语义处理单元包括依次连接的分词处理模块、同义转换模块、检索词生成模块、检索式生成模块和检索结果排序模块,所述分词处理模块用于去除用户输入检索语句中无意义用词,以提取出关键词和逻辑关系词;所述同义转换模块用于对关键词进行同义词转换,以得到规范词;所述检索词生成模块用于对规范词进行概念映射、对未进行同义词转换的关键词进行语义拓展,以得到检索词;所述检索式生成模块根据检索词以及逻辑关系词,以构造生成相应的检索式;所述检索结果排序模块根据检索式从技经本体知识库中检索得到多个检索结果,并对多个检索结果进行排序。一种基于知识图谱的工程技经知识检索方法,包括以下步骤:S1、构建技经本体知识库;S2、用户在交互单元输入检索语句;S3、基于用户输入的检索语句,语义处理单元从技经本体知识库检索得到对应的相关知识图谱;S4、交互单元将检索得到的相关知识图谱可视化展示给用户。进一步地,所述步骤S1具体包括以下步骤:S11、确定技经本体构建目标;S12、确定技经本体所覆盖的领域以及知识来源;S13、定义技经本体中所需的术语并进行分类;S14、定义本体间的层次关系和相关关系;S15、定义本体的属性;S16、对构建的本体进行评价,以判断本体是否需进行修改,若需修改则返回步骤S13或步骤S14,否则执行步骤S17;S17、根据知识来源的更新,对本体进行迭代修正,得到技经本体库;S18、在建立技经本体库之后,将本体术语形成知识节点,并存储为OWL(WebOntologyLanguage,网络本体语言)格式,之后用OWL和URL(UniversalResourceLocator,统一资源定位符)构建技经知识图谱的知识链接,即基于OWL的URL来实现本体知识的定位,以连接孤立的本体知识,从而搭建出本体知识网络、形成技经知识图谱,即得到技经本体知识库。进一步地,所述步骤S11中技经本体所覆盖的领域以及知识来源具体包括:从相关工程经济、工程造价或工程技术教材中获得的技术经济以造价基础理论知识;从行业相关专业性规范规程规定中获得的输变电工程知识及其技术经济知识;从教材、企业正式规范和办法、企业内部文件资料中获得的项目管理知识;从公司、地方以及国家相关法规规定中获得的法规知识;从企业历年输变电工程实际数据文献资料中获得的实际案例。进一步地,所述步骤S13具体包括以下步骤:S131、根据知识来源的目录大纲和具体内容,从知识来源中提取术语;S132、对术语进行规范化处理;S133、按照术语所属的知识来源,将规范化处理后的术语分为管理类、技经类、造价类、技术类、法规类和实例类。进一步地,所述步骤S132中规范化处理具体包括同义异词处理和同词异议处理。进一步地,所述步骤S14具体包括以下步骤:S141、将术语导入本体编码工具Protégé,形成树形结构的本体库,按需要学习的先后顺序进行术语的排布,通过Protégé自动形成术语的层次关系,所述层次关系包括基础关系和包含关系;S142、根据术语之间的关联度,建立术语之间的相关关系。进一步地,所述步骤S15中本体的属性包括数据属性和对象属性,所述数据属性为本体的内部属性,即本体本身所固有的、可传递的属性;所述对象属性为本体的外部属性,用于描述本体之间的属性关系。进一步地,所述步骤S3具体包括以下步骤:S31、基于词典的正向对大匹配算法,对用户输入的检索语句进行分词处理,即借助现有的词典,将检索语句每与词典匹配一次后,将检索语句从右边减少一个字,直到匹配成功或只剩一个字,匹配成功后将上一轮匹配的词从检索语句中去掉,进行下一轮匹配,以此从检索语句中提取得到关键词和逻辑关系词;S32、利用词汇矩阵模型构造适用于技术经济知识图谱的同义词典,以对关键词进行同义词转换,得到对应的规范词;S33、对规范词进行概念映射,并通过语义相似度计算,对未进行同义词转换的关键词进行语义拓展,得到多个检索词;S34、将逻辑关系词转换为布尔操作符,以连接多个检索词,得到检索式;S35、基于检索式,从技经本体知识库中检索得到对应的多个检索结果;S36、按照词频加权值和位置加权值的大小关系,对多个检索结果进行排序,得到最终的相关知识图谱。与现有技术相比,本专利技术具有以下优点:一、本专利技术通过建立输变电工程技经本体库,在本体库的基础上构建出知识图谱,以此建立输变电工程技经知识检索平台,实现了语义化检索以及可视化展示的目的,本专利技术提出的检索平台,一方面通过知识图谱技术建立技经知识间的映射关联,便于用户快速检索专业知识,提高检索与学习效率;另一方面,平台可形成技经管理的资料库,通过对相关资料进行集约化管理、滚动更新,形成综合性数据管理平台,对提高技经管理工作水平具有重要支撑作用,能够有效提高工程专业协作效率。二、本专利技术在构建工程技经本体知识库时,基于知识图谱技术,能够将与输变电工程相关的多个知识统一管理存储,并利用语义处理单元从技经本体知识库进行检索,使得用户通过单次本文档来自技高网...

【技术保护点】
1.一种基于知识图谱的工程技经知识检索平台,其特征在于,包括技经本体知识库、语义处理单元以及交互单元,所述技经本体知识库、交互单元分别与语义处理单元相互连接,所述技经本体知识库用于存储项目管理知识、技经知识、造价知识、工程技术知识、法规知识以及实际案例;/n所述语义处理单元根据用户输入的检索语句,生成对应的检索式,以从技经本体知识库中检索得到相关知识图谱;/n所述交互单元用于用户进行检索语句的输入操作,以及将检索得到的相关知识图谱可视化呈现给用户。/n

【技术特征摘要】
1.一种基于知识图谱的工程技经知识检索平台,其特征在于,包括技经本体知识库、语义处理单元以及交互单元,所述技经本体知识库、交互单元分别与语义处理单元相互连接,所述技经本体知识库用于存储项目管理知识、技经知识、造价知识、工程技术知识、法规知识以及实际案例;
所述语义处理单元根据用户输入的检索语句,生成对应的检索式,以从技经本体知识库中检索得到相关知识图谱;
所述交互单元用于用户进行检索语句的输入操作,以及将检索得到的相关知识图谱可视化呈现给用户。


2.根据权利要求1所述的一种基于知识图谱的工程技经知识检索平台,其特征在于,所述语义处理单元包括依次连接的分词处理模块、同义转换模块、检索词生成模块、检索式生成模块和检索结果排序模块,所述分词处理模块用于去除用户输入检索语句中无意义用词,以提取出关键词和逻辑关系词;
所述同义转换模块用于对关键词进行同义词转换,以得到规范词;
所述检索词生成模块用于对规范词进行概念映射、对未进行同义词转换的关键词进行语义拓展,以得到检索词;
所述检索式生成模块根据检索词以及逻辑关系词,以构造生成相应的检索式;
所述检索结果排序模块根据检索式从技经本体知识库中检索得到多个检索结果,并对多个检索结果进行排序。


3.一种应用权利要求1所述检索平台的工程技经知识检索方法,其特征在于,包括以下步骤:
S1、构建技经本体知识库;
S2、用户在交互单元输入检索语句;
S3、基于用户输入的检索语句,语义处理单元从技经本体知识库检索得到对应的相关知识图谱;
S4、交互单元将检索得到的相关知识图谱可视化展示给用户。


4.根据权利要求3所述的一种工程技经知识检索方法,其特征在于,所述步骤S1具体包括以下步骤:
S11、确定技经本体构建目标;
S12、确定技经本体所覆盖的领域以及知识来源;
S13、定义技经本体中所需的术语并进行分类;
S14、定义本体间的层次关系和相关关系;
S15、定义本体的属性;
S16、对构建的本体进行评价,以判断本体是否需进行修改,若需修改则返回步骤S13或步骤S14,否则执行步骤S17;
S17、根据知识来源的更新,对本体进行迭代修正,得到技经本体库;
S18、在建立技经本体库之后,将本体术语形成知识节点,并存储为OWL格式,之后用OWL和URL构建技经知识图谱的知识链接,即基于OWL的URL来实现本体知识的定位,以连接孤立的本体知识,从而搭建出本体知识网络、形成技经知识图谱,即得到技经本体知识库。


5.根据权利要求4所述的一种工程技经知识检索方法,其特征在于,所述步骤S12中技经本体所覆盖的领域以及知识来源具体包...

【专利技术属性】
技术研发人员:韩东费斐顾闻李灏恩吴恩琦陈凯玲徐雪莲
申请(专利权)人:国网上海市电力公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1