电网调度专业语言语义关系抽取方法、装置及电子设备制造方法及图纸

技术编号:21034768 阅读:35 留言:0更新日期:2019-05-04 05:35
本发明专利技术提供了一种电网调度专业语言语义关系抽取方法、装置及电子设备,其中,方法包括:采集电网运行过程中生成的调度历史语料库;对所述调度历史语料库中的各个所述语料文本分别进行词汇抽取,得到该语料文本包含的多个词汇,按照多个所述词汇在该语料文本中的排列顺序,构造每个所述词汇对应的词汇向量;基于每个所述词汇对应的词汇向量及预设的神经网络模型,构建每个所述词汇对应的语义向量;根据每个所述词汇对应的语义向量,计算所述词汇间的语义相似度,以确定所述词汇间的语义关系。本发明专利技术能够借助神经网络模型进行电网调度专业语义关系的快速、准确提取,避免调度人员的主观性影响及减少调度人员的工作担负。

Semantic Relation Extraction Method, Device and Electronic Equipment for Power Network Dispatching Language

【技术实现步骤摘要】
电网调度专业语言语义关系抽取方法、装置及电子设备
本专利技术涉及数据处理
,尤其涉及一种电网调度专业语言语义关系抽取方法、装置及电子设备。
技术介绍
近年来,随着智能电网调度控制系统的运行,电网调度自动化水平有了明显的提高。电网调度机构积累了大量的电网运行数据和调度管理数据。这些海量的历史数据蕴含了丰富的电网运行知识。如何从这些非结构化的数据中提取电网运行知识,为调度员进行电网调度提供辅助决策支撑,提升电网调度的智能化水平成为亟需解决的问题。专家库、知识库、知识图谱等人工智能相关技术为电网调度的智能化提供了解决思路,但是知识的提取成为构建知识库、知识图谱的关键步骤。目前主要解决方案是,调度人员基于专业背景,通过学习电网调度规程、年度运行方式、调度日志、事故预案等调度领域相关文档,理解调度领域语义关系,从而总结电网运行知识对电网调度专家库进行维护。这种方式存在以下缺点:电网运行方式复杂多变导致电网调度专家库的维护工作量较大,加大了调度人员的工作负担;由于调度人员的专业背景、工作经验等因人而异,导致专家库中的知识具备较大的主观性。
技术实现思路
有鉴于此,本专利技术实施例提供一种电网调本文档来自技高网...

【技术保护点】
1.一种电网调度专业语言语义关系抽取方法,其特征在于,包括:采集电网运行过程中生成的调度历史语料库;其中,所述调度历史语料库包括运行方式对应的语料文本、调度规程对应的语料文本、调度日志对应的语料文本和事故预案对应的语料文本;对所述调度历史语料库中的各个所述语料文本分别进行词汇抽取,得到该语料文本包含的多个词汇;按照多个所述词汇在该语料文本中的排列顺序,构造每个所述词汇对应的词汇向量;基于每个所述词汇对应的词汇向量及预设的神经网络模型,构建每个所述词汇对应的语义向量;根据每个所述词汇对应的语义向量,计算所述词汇间的语义相似度,以确定所述词汇间的语义关系。

【技术特征摘要】
1.一种电网调度专业语言语义关系抽取方法,其特征在于,包括:采集电网运行过程中生成的调度历史语料库;其中,所述调度历史语料库包括运行方式对应的语料文本、调度规程对应的语料文本、调度日志对应的语料文本和事故预案对应的语料文本;对所述调度历史语料库中的各个所述语料文本分别进行词汇抽取,得到该语料文本包含的多个词汇;按照多个所述词汇在该语料文本中的排列顺序,构造每个所述词汇对应的词汇向量;基于每个所述词汇对应的词汇向量及预设的神经网络模型,构建每个所述词汇对应的语义向量;根据每个所述词汇对应的语义向量,计算所述词汇间的语义相似度,以确定所述词汇间的语义关系。2.根据权利要求1所述的方法,其特征在于,对所述调度历史语料库中的各个所述语料文本分别进行词汇抽取,得到该语料文本包含的多个词汇的步骤,包括:对所述调度历史语料库中的各个所述语料文本分别进行正则化操作,去除各个所述语料文本中的标点符号和停用词;对所述正则化操作处理后的各个所述语料文本进行中文分词处理,得到该语料文本包含的多个词汇。3.根据权利要求1所述的方法,其特征在于,按照多个所述词汇在该语料文本中的排列顺序,构造每个所述词汇对应的词汇向量的步骤,包括:按照多个所述词汇在该语料文本中的排列顺序,确定每个所述词汇在多个所述词汇中的排名;以多个所述词汇的数量为向量长度,对每个所述词汇进行0-1编码,得到每个所述词汇对应的词汇向量;其中,所述词汇向量中词汇的排名对应的位置为1,其他位置为0。4.根据权利要求3所述的方法,其特征在于,得到每个所述词汇对应的词汇向量之后,还包括:将每个所述词汇在多个所述词汇中的排名作为所述词汇的索引;基于多个所述词汇、每个所述词汇对应的所述索引及所述词汇向量,生成词汇专业词典。5.根据权利要求1所述的方法,其特征在于,基于每个所述词汇对应的词汇向量及预设的神经网络模型,构建每个所述词汇对应的语义向量的步骤,包括:根据多个所述词汇对应的词汇向量及所述神经网络模型的预设窗口值,确定每个所述词汇对应的训练集;其中,所述神经网络模型包括输入层、隐藏层和输出层,所述隐藏层的大小为所述预设窗口值减一;将每个所述词汇对应的训练集中的样本输入所述神经网络模型的所...

【专利技术属性】
技术研发人员:王小海朱长胜庞传军蒿峰海威余建明单连飞吕宏伟
申请(专利权)人:内蒙古电力集团有限责任公司电力调度控制分公司北京科东电力控制系统有限责任公司
类型:发明
国别省市:内蒙古,15

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1