一种能源消费与碳排放的知识图谱实体提取方法技术

技术编号:32908851 阅读:34 留言:0更新日期:2022-04-07 11:59
本发明专利技术涉及能源消费领域,具体涉及一种能源消费与碳排放的知识图谱实体提取方法。其通过对能源消费实体进行形式化描述;采用实体抽取模型对能源消费实体进行实体抽取以及对未标注样本进行预测标注。解决了能源消费领域带标签的实体数据较少、获取标注数据成本昂贵的问题,同时也对对能源行业的碳排放预测提供了重要的数据依托。重要的数据依托。重要的数据依托。

【技术实现步骤摘要】
一种能源消费与碳排放的知识图谱实体提取方法


[0001]本专利技术涉及能源消费领域,具体涉及一种能源消费与碳排放的知识图谱实体提取方法。

技术介绍

[0002]随着全球温度的不断上升,气候变暖问题逐渐成为当前人类面临的重大环境问题之一。针对碳排放问题,如果不能通过有效的监控与预测措施来降低碳排放量,人类环境问题将更加严峻。电网企业主要掌握企业用电数据,这些用电数据为能源消费知识图谱构建提供了规模巨大且类型多样的数据资源,是一个海量的语料库,也是能源大数据分析的基础。现阶段以自然语言文本描述的非结构化数据是能源消费数据利用方面的一大障碍,但是由于自然语言没有相对统一的结构,其所有的监督学习模型依赖大量标注数据,而能源消费领域标注数据缺乏,对能源消费中的非结构化数据提取非常困难,进一步导致无法对能源企业做进一步的碳排放预测。

技术实现思路

[0003]本专利技术的目的在于提出了一种能源消费与碳排放的知识图谱实体提取方法,以解决能源消费领域带标签的实体数据较少、获取标注数据成本昂贵的问题,从而对能源行业的碳排放预测提供重要的数据依托。本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种能源消费与碳排放的知识图谱实体提取方法,其特征在于:包括以下步骤:S1.对能源消费实体进行形式化描述;S2.采用实体抽取模型对步骤S1所述的能源消费实体进行实体抽取;S3.对步骤S2中未标注样本进行预测标注。2.根据权利要求1所述的一种能源消费与碳排放的知识图谱实体提取方法,其特征在于:步骤S1中,所述形式化描述的方法为,(a)收集不同类型能源消费相关文本信息;(b)计算相应碳排放值;(c)定义能源消费领域的实体类型,随后对能源消费进行标注形成数据集,最后将所得到的数据集添加到训练集。3.根据权利要求1所述的一种能源消费与碳排放的知识图谱实体提取方法,其特征在于:所述步骤S2中,实体抽取模型采用基于transform的特征提取。4.根据权利要求3所述的一种能源消费与碳排放的知识图谱实体提取方法,其特征在于:所述基于transform的特征的提取方法包括以下步骤:S2.1、Transformer模型首先对输入序列每个字之间的特征关系进行提取与捕捉;S2.2、随后Tr...

【专利技术属性】
技术研发人员:何清素靳丹张兆师韩庆之何少军张天泰梁嘉文闵剑虹闵永智孙晓丽
申请(专利权)人:国网甘肃省电力公司甘南供电公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1