一种针对电力预案文本的基于长短时记忆网络的序列标注方法技术

技术编号:28035538 阅读:36 留言:0更新日期:2021-04-09 23:17
本发明专利技术公开一种基于长短时记忆神经网络的电力预案文本标注技术。公开的技术包括:针对电力预案文本的数据处理方法、电力预案领域专业词典构造方法、针对电力预案文本标注的分词方法、用于对电力预案文本标注的长短时记忆神经网络结构以及训练方法。其中针对电力预案文本的数据处理方法主要用于将原始预案文本处理成可用于网络训练的样本;电力预案领域专业词典构造方法用于将训练样本中出现的专业字词收集起来形成一个可复用的词典,对词典中每个词给予对应标识符;而针对电力预案标注的分词方法则是在专业词典的基础上做分词以避免受日常用语干扰;本发明专利技术还公开了用于电力预案文本标注的长短时记忆神经网络结构以及训练方法和参数设置。

【技术实现步骤摘要】
一种针对电力预案文本的基于长短时记忆网络的序列标注方法
本专利技术涉及自然语言处理以及深度学习领域,特别是涉及一种针对电力预案分析的文本序列标注技术。
技术介绍
一直以来电网调度系统依赖于管制员主观性的决策,是高强度的脑力劳动,这对调度员的可靠性要求极高。与调度员相比,计算机的运行速度快、实时性高、存储容量大、可靠性高。相比之下,调度员所能够承担的工作强度小、持续时间短、反应速度慢、记忆容量有限,效率不稳定,可靠性易受环境影响。随着电力系统迅速发展,电网调度系统运行变得紧张,使得调度员的工作强度变大、工作时间延长,从而导致调度员工作疲劳、精神不振,容易发出不当调度指令。如果能通过机器来辅助调度员甚至替代调度员进行管理,将能有效提高系统的性能和可靠性,这对减少安全事故具有重大和迫切的现实意义。现有调度自动化系统沉淀大量的告警信息、事故报告以及设备状态信息,以及不同来源、不同形式的数据信息。目前调度自动化系统都围绕着集中存储的告警信息开展数据分析,通常是采用统计分析、遗传算法等传统人工智能方法进行分析。基于大数据的深度学习在人工智能本文档来自技高网...

【技术保护点】
1.一种基于长短时记忆神经网络的电力预案文本标注技术,其特征在于利用长短时记忆神经网络对电力预案文本进行序列标注,所述文本标注方法包括:/n建立电力预案领域的专业词典;/n用于电力预案文本序列标注的分词方法;/n针对电力预案文本的数据标注方法和样本形式;/n针对电力预案文本序列标注的长短时记忆网络结构和训练方法。/n

【技术特征摘要】
1.一种基于长短时记忆神经网络的电力预案文本标注技术,其特征在于利用长短时记忆神经网络对电力预案文本进行序列标注,所述文本标注方法包括:
建立电力预案领域的专业词典;
用于电力预案文本序列标注的分词方法;
针对电力预案文本的数据标注方法和样本形式;
针对电力预案文本序列标注的长短时记忆网络结构和训练方法。


2.根据权利要求1所述的文本标注技术,其特征在于其应用领域是电力预案文本,电力预案文本有其难以处理的特殊性具体包括:
电力预案文本包含大量专业字词,其中有地名、变电站名、线路名、缩略词等等。
除大量专业字词外预案文本的语法也与日常用语不同,因此使用通用的工具处理预案文本效果并不理想。因此本发明提出了一种针对电力预案文本的分词方法,此方法基于电力预案专业词典进行分词。专业词典是从大量电力预...

【专利技术属性】
技术研发人员:杨群周凯刘绍翰
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1