【技术实现步骤摘要】
基于深度学习的电网项目特征属性识别方法
[0001]本专利技术属于命名实体识别与深度学习
,具体涉及一种基于深度学习的电网项目特征属性识别方法。
技术介绍
[0002]电网公司管理中,历史电网项目文档的归纳和汇总重要程度最高,当然难度也是最大的。借助高效的文档项目特征提炼技术,各公司可围绕精准管控、提质升效,从而提出综合计划管理高质量、精益化的发展要求,明晰投资的“盈利点”和“亏损点”,精准把控电网环节投资,减少非必要投入,提高资本投入有效性。文档特征提取环节,更应实现需求精准定位、方案智能筛选、进程准确把握,从而提升项目质量与管理效率。
[0003][0004]
技术实现思路
[0005]针对现有技术难以满足电网项目文档的高质量精益化管控要求及特征提取难的问题,本专利技术提出了一种基于深度学习的电网项目特征属性识别方法。为解决以上技术问题,本专利技术所采用的技术方案如下:
[0006]一种基于深度学习的电网项目特征属性识别方法,包括如下步骤:
[0007]S1,根据电网项目文档的类别和项 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习的电网项目特征属性识别方法,其特征在于,包括如下步骤:S1,根据电网项目文档的类别和项目业务管理需求总结项目业务特征,基于项目业务特征建立项目标签体系;S2,基于项目标签体系对电网项目文档进行分类;S3,对分类后的电网项目文档进行文本预处理;S4,借助开源文本标注工具对预处理后的电网项目文档进行实体标注,生成电网项目文档所对应的BIO格式数据集;S5,利用BERT模型、Bi
‑
GRU神经网络和CRF模型建立网络学习模型,将BIO格式数据集输入网络学习模型进行训练得到实体识别模型;S6,利用实体识别模型对新的电网项目文档进行特征识别。2.根据权利要求1所述的基于深度学习的电网项目特征属性识别方法,其特征在于,在步骤S1中,所述项目标签体系包括一级类别标签和二级实体标签,一级类别标签包括电网基建、产业基建、电网小型基建、生产技改、产业技改、生产辅助技改、零星购置、生产大修、产业大修、生产辅助大修、电力市场营销、电网数字化、研究开发、管理咨询、教育培训和股权投资,二级实体标签包括机构、电网信息化和金额。3.根据权利要求1所述的基于深度学习的电网项目特征属性识别方法,其特征在于,在步骤S3中,所述文本预处理的方法为:利用格式转换工具将电网项目文档的PDF文件转换为EXCEL格式后,剔除包括空白页、目录及参考文献的辅助信息,再将剔除后的文件转换为TXT文件。4.根据权利要求1所述的基于深度学习的电网项目特征属性识别方法,其特征在于,在步骤S4中,所述BIO格式数据集包括语句...
【专利技术属性】
技术研发人员:贾博森,张宇熙,彭国政,黄少远,张恒,王晓飞,赵娟,朱克平,谢颖捷,
申请(专利权)人:国网经济技术研究院有限公司国网浙江省电力有限公司经济技术研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。