一种绿色金融项目遴选评估方法技术

技术编号:24094644 阅读:49 留言:0更新日期:2020-05-09 09:42
本发明专利技术公开了一种绿色金融项目遴选评估方法,包括以下步骤:采集原始环境数据;基于原始环境数据建立数据主题表;针对数据主题表进行关键词提取,获得绿色标准关键词、绿色条件限制关键词及非绿色标准关键词,得到绿色标准知识库;针对申报材料进行关键词提取,并基于绿色关键词知识库进行关键词匹配,获得绿色项目库;基于绿色标准知识库和绿色项目库,建立遴选评估模型。本发明专利技术通过对环境数据进行分类整理,梳理绿色金融评估规则,并基于遴选评估模型来实现项目的评估,从而能够给应用评估单位实现相关绿色金融决策。

A method of selecting and evaluating green financial projects

【技术实现步骤摘要】
一种绿色金融项目遴选评估方法
本专利技术涉及数据处理
,特别涉及一种绿色金融项目遴选评估方法。
技术介绍
企绿色金融是指为支持环境改善、应对气候变化和资源节约高效利用的经济活动,即对环保、节能、清洁能源、绿色交通、绿色建筑等领域的项目投融资、项目运营、风险管理等所提供的金融服务。各地区正在大力通过金融推进项目的建设,但如何评估一个项目,则需要大量的行业知识以及政策数据,据不完全统计,国家一年所收到的申请金融评估的项目达到几十万个,评估工作量巨大,但目前仍主要依靠人工审核评估的方式,急需要一个标准的评估方法才可以满足评估的要求。
技术实现思路
为解决上述问题,本专利技术提供了一种绿色金融项目遴选评估方法。本专利技术采用以下技术方案:一种绿色金融项目遴选评估方法,其包括以下步骤:S1、采集原始环境数据;S2、基于原始环境数据建立数据主题表;S3、针对数据主题表进行关键词提取,获得绿色标准关键词、绿色条件限制关键词及非绿色标准关键词,得到绿色标准知识库;S4、针对申报材料进行关键词提取,并基于绿色关键词知识库进行关键词匹配,获得绿色项目库;S5、基于绿色标准知识库和绿色项目库,建立遴选评估模型。优选地,所述步骤S1的采集原始环境数据具体为:制定数据采集策略,利用爬虫工具对环保类网站进行数据采集,所述数据采集策略包括采集频度、采集方式,所述采集方式包括增量采集和全量采集。优选地,所述步骤S2包括以下分步骤:S21、针对原始环境数据按环境模型进行分类,分为基本信息、证照信息、环评信息、处罚信息、排污监测、挂牌督办及突发事件;S22、针对每类环境数据,按照数据库建表的方法建数据存储表,数据存储表包括描述数据的所有字段。优选地,所述步骤S4包括以下分步骤:S41、基于申报材料,利用正则表达式的方式匹配和绿色标准关键词、绿色条件限制关键词、非绿色标准关键词关联的关键词;S42、采用特征工程匹配关键词。优选地,所述步骤S42包括以下子步骤:S421、命名实体识别,所述命名实体识别包括窗口方法和句子方法,所述窗口方法使用当前预测词的上下文窗口进行输入,然后利用NN结构进行识别,所述句子方法以整个句子作为当前预测词的输入,加入了句子中相对位置特征来区分句子中的每个词,然后使用了一层卷积神经网络CNN结构;S422、实体关系提取,利用词向量、句法分析或分词方法进行实体关系提取;S423、文本信息分类,并进行序列标注。采用上述技术方案后,本专利技术与
技术介绍
相比,具有如下优点:本专利技术通过对环境数据进行分类整理,梳理绿色金融评估规则,并基于遴选评估模型来实现项目的评估,从而能够给应用评估单位实现相关绿色金融决策。附图说明图1为本专利技术的流程示意图;图2示出了绿色标准知识库;图3示出了卷积神经网络的结构;图4为本专利技术遴选评估模型的示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。实施例参考图1所示,本专利技术公开了一种绿色金融项目遴选评估方法,其包括以下步骤:S1、采集原始环境数据。制定数据采集策略,利用爬虫工具对环保类网站进行数据采集,所述数据采集策略包括采集频度、采集方式,所述采集方式包括增量采集和全量采集。S2、基于原始环境数据建立数据主题表。该步骤通过以下分步骤实现:S21、针对原始环境数据按环境模型进行分类,分为基本信息、证照信息、环评信息、处罚信息、排污监测、挂牌督办及突发事件。S22、针对每类环境数据,按照数据库建表的方法建数据存储表,数据存储表包括描述数据的所有字段。上述字段包括技术主键、安全生产许可类别、企业名称、地址、企业类型、负责人、许可范围、发证日期、有效期、证书编号、注销证书、备注、网页标题、详情链接、正文、页面标签详情、发布日期、审批文号、作者、发布机构、附件名称、附件ID、网址ID、数据采集日期、数据来源代码、数据逻辑删除标志、数据加载更新日期等。S3、针对数据主题表进行关键词提取,获得绿色标准关键词、绿色条件限制关键词及非绿色标准关键词,得到绿色标准知识库(如图2所示)。S4、针对申报材料进行关键词提取,并基于绿色关键词知识库进行关键词匹配,获得绿色项目库。S41、基于申报材料,利用正则表达式的方式匹配和绿色标准关键词、绿色条件限制关键词、非绿色标准关键词关联的关键词;S42、采用特征工程匹配关键词。S421、命名实体识别,所述命名实体识别包括窗口方法和句子方法,所述窗口方法使用当前预测词的上下文窗口进行输入,然后利用NN结构进行识别,所述句子方法以整个句子作为当前预测词的输入,加入了句子中相对位置特征来区分句子中的每个词,然后使用了一层卷积神经网络CNN结构。卷积神经网络的结构如图3所示。S422、实体关系提取,利用词向量、句法分析或分词方法进行实体关系提取。S423、文本信息分类,并进行序列标注。该步骤中进行文本信息分类和序列标注用到的模型包括LR(逻辑回归模型),SVM(支持向量机模型),HMM(隐马尔可夫模型),CRF(中文名称条件随机场算法),CNN(卷积神经网络),RNN(循环神经网络),LSTM(长短期记忆)。S5、基于绿色标准知识库和绿色项目库,建立遴选评估模型。遴选评估模型包含分类、关键词及权重,具体参考图4所示。以上所述,仅为本专利技术较佳的具体实施方式,但本专利技术的保护范围并不局限于此,任何熟悉本
的技术人员在本专利技术揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本专利技术的保护范围之内。因此,本专利技术的保护范围应该以权利要求的保护范围为准。本文档来自技高网
...

【技术保护点】
1.一种绿色金融项目遴选评估方法,其包括以下步骤:/nS1、采集原始环境数据;/nS2、基于原始环境数据建立数据主题表;/nS3、针对数据主题表进行关键词提取,获得绿色标准关键词、绿色条件限制关键词及非绿色标准关键词,得到绿色标准知识库;/nS4、针对申报材料进行关键词提取,并基于绿色关键词知识库进行关键词匹配,获得绿色项目库;/nS5、基于绿色标准知识库和绿色项目库,建立遴选评估模型。/n

【技术特征摘要】
1.一种绿色金融项目遴选评估方法,其包括以下步骤:
S1、采集原始环境数据;
S2、基于原始环境数据建立数据主题表;
S3、针对数据主题表进行关键词提取,获得绿色标准关键词、绿色条件限制关键词及非绿色标准关键词,得到绿色标准知识库;
S4、针对申报材料进行关键词提取,并基于绿色关键词知识库进行关键词匹配,获得绿色项目库;
S5、基于绿色标准知识库和绿色项目库,建立遴选评估模型。


2.如权利要求1所述的一种绿色金融项目遴选评估方法,其特征在于,所述步骤S1的采集原始环境数据具体为:
制定数据采集策略,利用爬虫工具对环保类网站进行数据采集,所述数据采集策略包括采集频度、采集方式,所述采集方式包括增量采集和全量采集。


3.如权利要求1所述的一种绿色金融项目遴选评估方法,其特征在于,所述步骤S2包括以下分步骤:
S21、针对原始环境数据按环境模型进行分类,分为基本信息、证照信息、环评信息、处罚信息、排污监测、挂牌督办及...

【专利技术属性】
技术研发人员:邱涛曾嘉凯
申请(专利权)人:厦门美契信息技术有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1