【技术实现步骤摘要】
一种碳相关文件分析方法及终端
[0001]本专利技术涉及文本处理
,尤其涉及一种碳相关文件分析方法及终端。
技术介绍
[0002]现有的碳相关文件数量众多,并在不断增多和深化,但少有理论对碳相关文件的具体影响开展系统性地逻辑分析。
技术实现思路
[0003]本专利技术所要解决的技术问题是:提供一种碳相关文件分析方法及终端,能够实现高效且可靠的碳相关文件分析。
[0004]为了解决上述技术问题,本专利技术采用的一种技术方案为:
[0005]一种碳相关文件分析方法,包括步骤:
[0006]获取碳相关文件,并对所述碳相关文件进行标准化处理,得到处理后的碳相关文件;
[0007]基于所述处理后的碳相关文件生成碳词语集;
[0008]基于所述碳词语集筛选出特征关键词,并对所述特征关键词进行属性分析,形成碳词典库;
[0009]基于所述碳词典库构建碳图谱逻辑模型,并对所述碳图谱逻辑模型进行可视化展示与分析。
[0010]为了解决上述技术问题,本专利技术采用的另
【技术保护点】
【技术特征摘要】
1.一种碳相关文件分析方法,其特征在于,包括步骤:获取碳相关文件,并对所述碳相关文件进行标准化处理,得到处理后的碳相关文件;基于所述处理后的碳相关文件生成碳词语集;基于所述碳词语集筛选出特征关键词,并对所述特征关键词进行属性分析,形成碳词典库;基于所述碳词典库构建碳图谱逻辑模型,并对所述碳图谱逻辑模型进行可视化展示与分析。2.根据权利要求1所述的一种碳相关文件分析方法,其特征在于,所述基于所述处理后的碳相关文件生成碳词语集包括:采用最短路径算法对所述处理后的碳相关文件进行分词处理,得到碳知识词语,并根据所述碳知识词语生成碳词语集。3.根据权利要求1所述的一种碳相关文件分析方法,其特征在于,所述基于所述碳词语集筛选出特征关键词包括:对所述碳词语集中每一碳相关文件对应的词语采用词袋模型生成特征向量;获取预设一般文件;基于所述特征向量与所述预设一般文件使用TF
‑
IDF模型从所述特征向量中筛选出特征关键词。4.根据权利要求1所述的一种碳相关文件分析方法,其特征在于,所述基于所述碳词典库构建碳图谱逻辑模型包括:从所述碳词典库中选取在所述处理后的碳相关文件中出现频次最高的词语;将所述出现频次最高的词语确定为核心节点;按照文本距离从所述碳词典库中确定出与所述核心节点对应的其他节点;根据所述核心节点与所述其他节点构建初始碳图谱逻辑模型;获取与所述初始碳图谱逻辑模型对应的修正信息,并根据所述修正信息对所述初始碳图谱逻辑模型进行修正,形成碳图谱逻辑模型。5.根据权利要求1所述的一种碳相关文件分析方法,其特征在于,所述对所述碳图谱逻辑模型进行可视化展示与分析包括:对所述碳图谱逻辑模型进行可视化展示;对所述碳图谱逻辑模型对应的所述碳词典库中的词语按照出现频次进行排序,得到排序后的碳词典库;根据所述排序后的碳词典库中排序前预设数量的词语生成词云,并根据所述碳图谱逻辑模型对所述词云之间的关系进行展示。6.一种碳相关文件分析终端,包括存储器、处理器及存储在存储器上并可...
【专利技术属性】
技术研发人员:杜翼,项康利,陈柯任,施鹏佳,郑楠,陈津莼,陈晚晴,陈晗,蔡期塬,李源非,林晓凡,陈思敏,李益楠,林昶咏,
申请(专利权)人:国网福建省电力有限公司经济技术研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。