基于文本分析的双碳知识图谱数据分析方法及系统技术方案

技术编号:38722514 阅读:11 留言:0更新日期:2023-09-08 23:16
本发明专利技术公开了一种基于文本分析的双碳知识图谱数据分析方法及系统,该方法包括:获取多个信息源的双碳相关文本数据和数据获取参数;根据预设的数据筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据和排放数据;根据所述双碳政策要求数据和预设的知识图谱算法模型,确定新的双碳政策要求;根据所述排放数据、所述数据获取参数和所述双碳政策要求,来确定对应区域的排放是否满足双碳政策要求。可见,本发明专利技术能够实现完全自动化和智能化的双碳政策分析和排放分析,提高双碳政策的推行效率和效果。策的推行效率和效果。策的推行效率和效果。

【技术实现步骤摘要】
基于文本分析的双碳知识图谱数据分析方法及系统


[0001]本专利技术涉及文本数据处理
,尤其涉及一种基于文本分析的双碳知识图谱数据分析方法及系统。

技术介绍

[0002]随着绿色城市和绿色排放意识的提高,以及双碳政策的推行,越来越多的企业开始关注如何有效监控双碳政策的更新以及控制排放的合规。现有技术在解决这一问题时,一般只采用人工的政策解读和排放统计来执行,没有考虑到结合语言模型和文本分析算法来提高效率和效果。可见,现有技术存在缺陷,亟需解决。

技术实现思路

[0003]本专利技术所要解决的技术问题在于,提供一种基于文本分析的双碳知识图谱数据分析方法及系统,能够实现完全自动化和智能化的双碳政策分析和排放分析,提高双碳政策的推行效率和效果。
[0004]为了解决上述技术问题,本专利技术第一方面公开了一种基于文本分析的双碳知识图谱数据分析方法,所述方法包括:
[0005]获取多个信息源的双碳相关文本数据和数据获取参数;
[0006]根据预设的数据筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据和排放数据;
[0007]根据所述双碳政策要求数据和预设的知识图谱算法模型,确定新的双碳政策要求;
[0008]根据所述排放数据、所述数据获取参数和所述双碳政策要求,来确定对应区域的排放是否满足双碳政策要求。
[0009]作为一种可选的实施方式,在本专利技术第一方面中,所述数据获取参数包括数据获取来源、数据获取时设备参数、数据类型、数据总大小、数据识别用时中的至少一种;所述数据获取时设备参数包括设备类型、设备性能参数和设备电量中的至少一种。
[0010]作为一种可选的实施方式,在本专利技术第一方面中,所述根据预设的数据筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据和排放数据,包括:
[0011]根据训练好的政策要求筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据;
[0012]根据训练好的排放筛选分类器模型,从所述双碳相关文本数据中筛选出排放数据。
[0013]作为一种可选的实施方式,在本专利技术第一方面中,所述政策要求筛选分类器模型包括一个政策类型预测模型和多个政策相关度预测模型,所述政策类型预测模型用于根据预设的政策关键字库对输入的任一所述双碳相关文本数据的政策关键字进行筛选获取,并通过预测分类器基于获取到的政策关键字预测该双碳相关文本数据的政策类型;每一所述
政策相关度预测模型用于预测一种对应的所述政策类型的双碳相关文本数据的政策相关度;所述根据训练好的政策要求筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据,包括:
[0014]对于任一所述双碳相关文本数据,将该双碳相关文本数据输入至所述政策类型预测模型,以得到该双碳相关文本数据对应的政策关键字和政策类型;
[0015]将该双碳相关文本数据的所述政策关键字的前后预设字符范围内的相关文本输入至所述政策类型对应的所述政策相关度预测模型中,以得到该双碳相关文本数据对应的政策相关度;
[0016]根据所述政策相关度从大到小对所有所述双碳相关文本数据进行排序得到第一数据序列,将所述第一数据序列的前第一数量个所述双碳相关文本数据的所述相关文本确定为双碳政策要求数据。
[0017]作为一种可选的实施方式,在本专利技术第一方面中,所述排放筛选分类器模型包括一个数值类型预测模型和多个排放相关度预测模型,所述数值类型预测模型用于根据数值检测算法对输入的任一所述双碳相关文本数据的数值数据进行筛选获取,并通过预测分类器基于获取到的数值数据预测该数值数据的数据类型;每一所述排放相关度预测模型用于预测一种对应的所述数据类型的双碳相关文本数据的排放相关度;
[0018]所述根据训练好的排放筛选分类器模型,从所述双碳相关文本数据中筛选出排放数据,包括:
[0019]对于任一所述双碳相关文本数据,将该双碳相关文本数据输入至所述数值类型预测模型,以得到该双碳相关文本数据对应的数值数据和数据类型;
[0020]将该双碳相关文本数据的所述数值数据输入至所述数据类型对应的所述排放相关度预测模型中,以得到该双碳相关文本数据对应的排放相关度;
[0021]根据所述排放相关度从大到小对所有所述双碳相关文本数据进行排序得到第二数据序列,将所述第二数据序列的前第二数量个所述双碳相关文本数据的所述数值数据确定为排放数据。
[0022]作为一种可选的实施方式,在本专利技术第一方面中,所述根据所述双碳政策要求数据和预设的知识图谱算法模型,确定新的双碳政策要求,包括:
[0023]根据预设的知识图谱算法模型,对所述双碳政策要求数据进行分析以得到数据逻辑推导结果;
[0024]将所述数据逻辑推导结果的每一部分与预设的现有政策数据的对应部分进行相似度比较,并将相似度最低的部分推送给用户端;所述用户端基于所述相似度最低的部分修改所述现有政策数据以得到新的双碳政策要求。
[0025]作为一种可选的实施方式,在本专利技术第一方面中,所述根据所述排放数据、所述数据获取参数和所述双碳政策要求,来确定对应区域的排放是否满足双碳政策要求,包括:
[0026]根据所述排放数据对应的所述数据获取参数,确定所述排放数据对应的区域;
[0027]对于任一所述区域对应的任一所述排放数据,将该排放数据对应的所述数据获取参数输入至训练好的数据可信度预测模型,以得到该排放数据对应的数据可信度权重;
[0028]计算该排放数据与所述双碳政策要求中的对应指标阈值的差值,以及所述差值和所述数据可信度权重的乘积;
[0029]计算该区域中所有所述排放数据对应的所述乘积的求和平均值,得到该区域对应的排放参数;
[0030]判断所述排放参数是否大于预设的参数阈值,若是则确定该区域的排放不满足双碳政策要求,否则确定该区域的排放满足双碳政策要求。
[0031]本专利技术第二方面公开了一种基于文本分析的双碳知识图谱数据分析系统,所述系统包括:
[0032]获取模块,用于获取多个信息源的双碳相关文本数据和数据获取参数;
[0033]筛选模块,用于根据预设的数据筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据和排放数据;
[0034]第一确定模块,用于根据所述双碳政策要求数据和预设的知识图谱算法模型,确定新的双碳政策要求;
[0035]第二确定模块,用于根据所述排放数据、所述数据获取参数和所述双碳政策要求,来确定对应区域的排放是否满足双碳政策要求。
[0036]作为一种可选的实施方式,在本专利技术第二方面中,所述数据获取参数包括数据获取来源、数据获取时设备参数、数据类型、数据总大小、数据识别用时中的至少一种;所述数据获取时设备参数包括设备类型、设备性能参数和设备电量中的至少一种。
[0037]作为一种可选的实施方式,在本专利技术第二方面中,所述筛选模块根据预设的数据筛选分类器模型,从所述双碳相关文本数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于文本分析的双碳知识图谱数据分析方法,其特征在于,所述方法包括:获取多个信息源的双碳相关文本数据和数据获取参数;根据预设的数据筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据和排放数据;根据所述双碳政策要求数据和预设的知识图谱算法模型,确定新的双碳政策要求;根据所述排放数据、所述数据获取参数和所述双碳政策要求,来确定对应区域的排放是否满足双碳政策要求。2.根据权利要求1所述的基于文本分析的双碳知识图谱数据分析方法,其特征在于,所述数据获取参数包括数据获取来源、数据获取时设备参数、数据类型、数据总大小、数据识别用时中的至少一种;所述数据获取时设备参数包括设备类型、设备性能参数和设备电量中的至少一种。3.根据权利要求1所述的基于文本分析的双碳知识图谱数据分析方法,其特征在于,所述根据预设的数据筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据和排放数据,包括:根据训练好的政策要求筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据;根据训练好的排放筛选分类器模型,从所述双碳相关文本数据中筛选出排放数据。4.根据权利要求3所述的基于文本分析的双碳知识图谱数据分析方法,其特征在于,所述政策要求筛选分类器模型包括一个政策类型预测模型和多个政策相关度预测模型,所述政策类型预测模型用于根据预设的政策关键字库对输入的任一所述双碳相关文本数据的政策关键字进行筛选获取,并通过预测分类器基于获取到的政策关键字预测该双碳相关文本数据的政策类型;每一所述政策相关度预测模型用于预测一种对应的所述政策类型的双碳相关文本数据的政策相关度;所述根据训练好的政策要求筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据,包括:对于任一所述双碳相关文本数据,将该双碳相关文本数据输入至所述政策类型预测模型,以得到该双碳相关文本数据对应的政策关键字和政策类型;将该双碳相关文本数据的所述政策关键字的前后预设字符范围内的相关文本输入至所述政策类型对应的所述政策相关度预测模型中,以得到该双碳相关文本数据对应的政策相关度;根据所述政策相关度从大到小对所有所述双碳相关文本数据进行排序得到第一数据序列,将所述第一数据序列的前第一数量个所述双碳相关文本数据的所述相关文本确定为双碳政策要求数据。5.根据权利要求3所述的基于文本分析的双碳知识图谱数据分析方法,其特征在于,所述排放筛选分类器模型包括一个数值类型预测模型和多个排放相关度预测模型,所述数值类型预测模型用于根据数值检测算法对输入的任一所述双碳相关文本数据的数值数据进行筛选获取,并通过预测分类器基于获取到的数值数据预测该数值数据的数据类型;每一所述排放相关度预测模型用于预测一种对应的所述数据类型的双碳相关文本数据的排放相关度;所述根据训练好的排放筛选分类器模型,从所述双碳相关文本数据中筛选出排放数
据,包括:对于任一所述双碳相关文本数据,将该双碳...

【专利技术属性】
技术研发人员:李卫红
申请(专利权)人:广东师大维智信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1