System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及电力安全生产,更具体的说是涉及一种电力安全生产风险防控知识图谱的构建方法及系统。
技术介绍
1、知识图谱是一种结构化的、语义化的知识表示方式,它通过将现实世界中的实体、概念、关系等信息进行抽象和组织,构建起一个具有层次结构的知识网络。
2、随着人工智能和大数据技术的发展,知识图谱已经在各个领域广泛应用。但由于电网作业现场点多广面,存在多个作业点同时进行,作业人员分散在不同的地点,缺乏统一的过程管控手段,使得现场安全难以有效监控和控制。另外,电力安全规程及各类反违章制度繁多并且采用线下方式进行,而作业人员流动性大,自身技术水平有差异,导致大量作业人员未经过有效培训或培训效果不佳就入场从事高风险施工作业,难以有效辨识作业风险点。
3、目前,构建电力安全生产风险防控知识图谱的方法主要有,一是手工构建知识图谱:优点:知识的准确性、可靠性高,可控性好。缺点:需要人工投入大量的时间和精力;随着电力的逐步发展,新的电力安全风险会不断出现,电力安全生产风险防控知识图谱中信息则需要不断的更新和维护,而手动构建知识图谱难以及时更新和更新,降低知识图谱的可靠性和实用性,同时导致作业人员无法获取最新安全信息,从而增加电力安全事故发生的风险。二是基于人工智能构建知识图谱,从大量的数据中自动提取和组织知识,提高知识的获取和利用效率,但由于数据来源多样,导致数据质量不稳定,无法给作业用户提供可靠的决策依据。
4、因此,如何设计一种电力安全生产风险防控知识图谱的构建方法,提高电池的性能和可靠性是本领域技术人员亟
技术实现思路
1、有鉴于此,本专利技术提供了一种电力安全生产风险防控知识图谱的构建方法及系统,将电力安全生产风险防控领域的数据和知识进行结构化整理,形成一个动态的、可视化的安全知识库、风险防控知识库。
2、为了实现上述目的,本专利技术采用如下技术方案:
3、第一方面,本专利技术提供一种电力安全生产风险防控知识图谱的构建方法,其特征在于,包括:
4、步骤一、获取电力安全生产风险防控数据;
5、步骤二、对所述电力安全生产风险防控数据进行清洗;
6、步骤三、将清洗后的电力安全生产风险防控数据进行变换和编码,转换成适合计算机处理的向量形式;
7、步骤四、基于bi-lstm-crf模型对向量形式的电力安全生产风险防控数据进行实体识别,获得实体识别结果,作为节点文件;
8、步骤五、基于卷积神经网络模型,对所述实体识别结果进行关系抽取,获得分类后的最终特征向量,作为关系文件;
9、步骤六、使用neo4j-import命令将所述节点文件与关系文件导入neo4j数据库中,形成电力安全生产风险防控知识图谱。
10、优选的,所述步骤二,对所述电力安全生产风险防控数据进行清洗,包括:
11、将所述电力安全生产风险防控数据统一文件格式;
12、对统一文件格式后的文本数据进行数据清洗,去除非法字符、空格、换行符和停用词;
13、运用滑动窗口对长句进行拆分重组处理。
14、优选的,所述步骤三,将清洗后的电力安全生产风险防控数据进行变换和编码,转换成适合计算机处理的向量形式,包括:
15、对电力安全生产风险防控数据语句中的每个不重复的字分别进行编号,假设每个词语映射到一个d维的词向量,获得词向量矩阵l;
16、使用skip-gram模型对所述词向量矩阵l进行优化训练,为每个词语学习准确的词向量表示;
17、模型训练结束后,得到优化后的词向量矩阵l*;所述词向量矩阵l*包含所有词语的分布式向量表示。
18、优选的,所述步骤四,基于bi-lstm-crf模型对向量形式的电力安全生产风险防控数据进行实体识别,获得实体识别结果,包括:
19、给定电力安全生产风险防控数据汉字序列x=x0,x1...xt,在训练好的词向量表中查找每个汉字xi对应的词向量ei;
20、基于前向lstm得到每个“字”对应的隐藏层表示可以捕捉e(i)及左侧的上下文信息e0…ei-1,ei;
21、基于后向lstm得到每个“字”对应的另一个隐藏层表示可以捕捉e(i)及右侧的上下文信息ei,ei+1,…et;
22、对和进行拼接,捕捉所述词向量e(i)为中心的全局特征,得到标签序列y=y0,y1…yt,构建p(y|x)条件概率模型。
23、优选的,所述步骤四,基于bi-lstm-crf模型对向量形式的电力安全生产风险防控数据进行实体识别,获得实体识别结果,还包括:
24、使用维特比算法对模型进行解码,得到句子结尾第t个“字”所对应的标签;
25、对所述句子结尾第t个“字”所对应的标签进行回溯,找到最优的标签路径;
26、采用bieso标注体系标注实体,对地名和组织机构名进行表示,采用863词性标注集标注词性,获得实体识别结果。
27、优选的,所述步骤五,基于卷积神经网络模型,对所述实体识别结果进行关系抽取,获得分类后的最终特征向量,包括:
28、基于所述实体识别结果,获得句子的最终词序列及对应向量;
29、对所述对应向量进行卷积运算,并将卷积结果通过非线性的激活函数得到一系列特征结果值;
30、对所述一系列特征结果值经过池化过程进行降维操作,得到每个滤波器中的最大特征值;
31、将所述每个滤波器中的最大特征值合并形成最终特征向量,通过分类器对所述最终特征向量进行分类。
32、优选的,所述步骤六,使用neo4j-import命令将节点与关系文件导入neo4j数据库中,形成电力安全生产风险防控知识图谱,包括:
33、根据安全生产风险防控的领域知识,定义相关的节点类型和关系类型;
34、将从文本中识别出的实体作为节点构建节点文件,根据实体之间的关系构建关系文件;
35、将所述节点文件和关系文件使用neo4j-import命令导入到neo4j数据库中,构建电力安全生产风险防控知识图谱。
36、第二方面,本专利技术提供一种电力安全生产风险防控知识图谱的构建系统,用于实现上述电力安全生产风险防控知识图谱的构建方法。
37、经由上述的技术方案可知,与现有技术相比,本专利技术技术方案存在以下
38、有益效果:
39、1.通过对电力安全生产防控知识的整合、特征分析、精简优化、样本训练等操作,运用卷积神经网络、双向长短期记忆神经网络和条件随机场模型,实现文本的实体准确识别和抽取,并构建一个全面的、动态更新的知识图谱。
40、2.通过基于神经网络的电力安全生产风险防控知识图谱的构建,我们能够更好地整合、理解和管理电力安全生产风险防控知识,更准确地评估和预测电力安全生产风险,并提供相应的防控措施险,从而提高电力安全生产的效率。本文档来自技高网...
【技术保护点】
1.一种电力安全生产风险防控知识图谱的构建方法,其特征在于,包括:
2.根据权利要求1所述的一种电力安全生产风险防控知识图谱的构建方法,其特征在于,所述步骤二,对所述电力安全生产风险防控数据进行清洗,包括:
3.根据权利要求1所述的一种电力安全生产风险防控知识图谱的构建方法,其特征在于,所述步骤三,将清洗后的电力安全生产风险防控数据进行变换和编码,转换成适合计算机处理的向量形式,包括:
4.根据权利要求1所述的一种电力安全生产风险防控知识图谱的构建方法,其特征在于,所述步骤四,基于Bi-LSTM-CRF模型对向量形式的电力安全生产风险防控数据进行实体识别,获得实体识别结果,包括:
5.根据权利要求1所述的一种电力安全生产风险防控知识图谱的构建方法,其特征在于,所述步骤四,基于Bi-LSTM-CRF模型对向量形式的电力安全生产风险防控数据进行实体识别,获得实体识别结果,还包括:
6.根据权利要求1所述的一种电力安全生产风险防控知识图谱的构建方法,其特征在于,所述步骤五,基于卷积神经网络模型,对所述实体识别结果进行关系抽取,
7.根据权利要求1所述的一种电力安全生产风险防控知识图谱的构建方法,其特征在于,所述步骤六,使用Neo4j-import命令将节点与关系文件导入Neo4j数据库中,形成电力安全生产风险防控知识图谱,包括:
8.一种电力安全生产风险防控知识图谱的构建系统,用于实现如权利1-7任一项所述的电力安全生产风险防控知识图谱的构建方法。
...【技术特征摘要】
1.一种电力安全生产风险防控知识图谱的构建方法,其特征在于,包括:
2.根据权利要求1所述的一种电力安全生产风险防控知识图谱的构建方法,其特征在于,所述步骤二,对所述电力安全生产风险防控数据进行清洗,包括:
3.根据权利要求1所述的一种电力安全生产风险防控知识图谱的构建方法,其特征在于,所述步骤三,将清洗后的电力安全生产风险防控数据进行变换和编码,转换成适合计算机处理的向量形式,包括:
4.根据权利要求1所述的一种电力安全生产风险防控知识图谱的构建方法,其特征在于,所述步骤四,基于bi-lstm-crf模型对向量形式的电力安全生产风险防控数据进行实体识别,获得实体识别结果,包括:
5.根据权利要求1所述的一种电力安全生产风险防控知识图...
【专利技术属性】
技术研发人员:靳丹,范雪峰,吴兆彬,薛鑫,金珑,张成杨,周龙,何军,侯炎伦,蔡健,张少辉,王亚峰,张乐桢,王妮,陈彦发,孙启娟,李相,魏立保,
申请(专利权)人:国网甘肃省电力公司白银供电公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。