绿色资产的占比的识别方法及相关产品技术

技术编号:32830001 阅读:9 留言:0更新日期:2022-03-26 20:40
本申请涉及人工智能技术领域,具体公开了一种绿色资产的占比的识别方法及相关产品,该方法包括获取多个数字资产的多份披露数据;基于多份披露数据,确定目标数字资产;将目标数字资产的披露数据输入到机器阅读理解模型,得到多个第一文本段;将各第一文本段分别输入到语义信息提取模型,得到各第一文本段的第一特征向量;将多个第二文本段分别输入到语义信息提取模型,得到每个第二文本段的第二特征向量;根据各第一文本段的第一特征向量以及每个第二文本段的第二特征向量,确定目标第一文本段;将目标第一文本段所描述的资金金额与目标数字资产的总资金金额的比例,作为目标数字资产中的绿色资产的占比。产中的绿色资产的占比。产中的绿色资产的占比。

【技术实现步骤摘要】
绿色资产的占比的识别方法及相关产品


[0001]本申请涉及人工智能
,具体涉及一种绿色资产的占比的识别方法及相关产品。

技术介绍

[0002]在全球气候变化合作的大背景下,各个管理部门需要厘清在自己管辖范围内的绿色和非绿色资产规模,以便更加科学的部署碳达峰和碳中和的实现路径。
[0003]投资机构在实现碳达峰和碳中和的过程中扮演着非常重要的角色,其投资标的的选择实际上将引导企业向绿色产业和碳中和达标的方向发展。
[0004]投资机构在统计其绿色投资比例时,由于监管和保密的需要,不能进行跨部门共享,都是由各个部门进行人工统计,主观性较强,精度低。

技术实现思路

[0005]本申请实施例提供了一种绿色资产的占比的识别方法及相关产品,提高数字资产中的绿色资产的占比的识别精度。
[0006]第一方面,本申请实施例提供一种基于相似度的数字资产中的绿色资产的占比的识别方法,该方法包括:
[0007]获取多个数字资产的多份披露数据,其中,所述多个数字资产与所述多份披露数据一一对应;
[0008]基于所述多份披露数据,确定所述多个数字资产中的目标数字资产,其中,所述目标数字资产具有绿色属性;
[0009]将所述目标数字资产的披露数据输入到机器阅读理解模型进行文本分割,得到多个第一文本段,其中,所述多个第一文本段用于描述所述目标数字资产的多项资金用途;
[0010]将各所述第一文本段分别输入到语义信息提取模型进行语义信息提取,得到各所述第一文本段的第一特征向量;
[0011]将多个第二文本段分别输入到所述语义信息提取模型进行语义信息提取,得到所述多个第二文本段中的每个第二文本段的第二特征向量,其中,所述多个第二文本段用于描述多个第一产业,所述多个第一产业为具有绿色属性的产业;
[0012]根据各所述第一文本段的第一特征向量以及所述每个第二文本段的第二特征向量,确定各所述第一文本段与所述每个第二文本段的相似度;
[0013]根据各所述第一文本段与所述每个第二文本段的相似度,确定所述多个第一文本段中的目标第一文本段;
[0014]将所述目标第一文本段所描述的资金用途中规划的资金金额与所述目标数字资产的总资金金额的比例,作为所述目标数字资产中的绿色资产的占比。
[0015]第二方面,本申请实施例提供一种绿色资产的占比的识别装置,包括:获取单元和处理单元;
[0016]所述获取单元,用于获取多个数字资产的多份披露数据,其中,所述多个数字资产与所述多份披露数据一一对应;
[0017]所述处理单元,用于基于所述多份披露数据,确定所述多个数字资产中的目标数字资产,其中,所述目标数字资产具有绿色属性;
[0018]将所述目标数字资产的披露数据输入到机器阅读理解模型进行文本分割,得到多个第一文本段,其中,所述多个第一文本段用于描述所述目标数字资产的多项资金用途;
[0019]将各所述第一文本段分别输入到语义信息提取模型进行语义信息提取,得到各所述第一文本段的第一特征向量;
[0020]将多个第二文本段分别输入到所述语义信息提取模型进行语义信息提取,得到所述多个第二文本段中的每个第二文本段的第二特征向量,其中,所述多个第二文本段用于描述具有绿色属性的多个第一产业;
[0021]根据各所述第一文本段的第一特征向量以及所述每个第二文本段的第二特征向量,确定各所述第一文本段与所述每个第二文本段的相似度;
[0022]根据各所述第一文本段与所述每个第二文本段的相似度,确定所述多个第一文本段中的目标第一文本段;
[0023]将所述目标第一文本段所描述的资金用途中规划的资金金额与所述目标数字资产的总资金金额的比例,作为所述目标数字资产中的绿色资产的占比。
[0024]第三方面,本申请实施例提供一种电子设备,包括:处理器,所述处理器与存储器相连,所述存储器用于存储计算机程序,所述处理器用于执行所述存储器中存储的计算机程序,以使得所述电子设备执行如第一方面所述的方法。
[0025]第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序使得计算机执行如第一方面所述的方法。
[0026]第五方面,本申请实施例提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机可操作来使计算机执行如第一方面所述的方法。
[0027]实施本申请实施例,具有如下有益效果:
[0028]可以看出,在本申请实施例中,获取债券的披露数据,即可从多个债券中筛选出具有绿色属性的债券,即目标数字资产;然后,基于目标数字资产的披露数据,通过文本分割和相似度匹配技术自动识别出该目标数字资产中的绿色资产的占比,从而无需人工统计,减少了人力成本,以及避免了人工统计的主观性,提高了数字资产中的绿色资产的占比的识别精度。
附图说明
[0029]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0030]图1为本申请实施例提供的一种基于相似度的数字资产中的绿色资产的占比的识别方法的流程示意图;
[0031]图2为本申请实施例提供的另一种基于相似度的数字资产中的绿色资产的占比的识别方法的流程示意图;
[0032]图3为本申请实施例提供的一种绿色资产的占比的识别装置的功能单元组成框图;
[0033]图4为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
[0034]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0035]本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0036]在本文中提及“实施例”意味着,结合实施例描述的特定特征、结果或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0037]本申请实施例可以基于人工智能技术对相关的数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于相似度的数字资产中的绿色资产的占比的识别方法,其特征在于,包括:获取多个数字资产的多份披露数据,其中,所述多个数字资产与所述多份披露数据一一对应;基于所述多份披露数据,确定所述多个数字资产中的目标数字资产,其中,所述目标数字资产具有绿色属性;将所述目标数字资产的披露数据输入到机器阅读理解模型进行文本分割,得到多个第一文本段,其中,所述多个第一文本段用于描述所述目标数字资产的多项资金用途;将各所述第一文本段分别输入到语义信息提取模型进行语义信息提取,得到各所述第一文本段的第一特征向量;将多个第二文本段分别输入到所述语义信息提取模型进行语义信息提取,得到所述多个第二文本段中的每个第二文本段的第二特征向量,其中,所述多个第二文本段用于描述具有绿色属性的多个第一产业;根据各所述第一文本段的第一特征向量以及所述每个第二文本段的第二特征向量,确定各所述第一文本段与所述每个第二文本段的相似度;根据各所述第一文本段与所述每个第二文本段的相似度,确定所述多个第一文本段中的目标第一文本段;将所述目标第一文本段所描述的资金用途中规划的资金金额与所述目标数字资产的总资金金额的比例,作为所述目标数字资产中的绿色资产的占比。2.根据权利要求1所述的方法,其特征在于,将各所述第一文本段分别输入到语义信息提取模型进行语义信息提取,得到各所述第一文本段的第一特征向量之前,所述方法还包括:构建初始模型,所述初始模型包括语义信息提取模型和多层感知器;将训练样本输入到所述语义信息提取模型进行语义信息提取,得到所述训练样本的第三特征向量;将所述第三特征向量输入到所述多层感知器,得到所述训练样本属于具有绿色属性的产业的概率;根据所述训练样本属于具有绿色属性的产业的概率,以及所述训练样本的标签,对所述初始模型进行训练,得到目标模型;将所述目标模型中的所述多层感知器删除,得到所述语义信息提取模型。3.根据权利要求1或2所述的方法,其特征在于,所述根据各所述第一文本段与所述每个第二文本段的相似度,确定所述多个第一文本段中的目标第一文本段,包括:根据各所述第一文本段与所述每个第二文本段的相似度,确定各所述第一文本段对应的最大相似度;将所述多个第一文本段中所对应的最大相似度大于第一阈值的第一文本段,作为所述目标第一文本段。4.根据权利要求1

3中任一项所述的方法,其特征在于,所述基于所述多个数字资产的披露数据,确定所述多个数字资产中的目标数字资产,包括:根据第一数字资产的披露数据,确定所述第一数字资产的资产名称,所述第一数字资产为所述多个数字资产中的任意一个;
对所述资产名称进行关键词提取,得到第一关键词;若所述第一关键词属于预设关键词集合中的关键词,确定所述第一数字资产为所述目标数字资产,其中,所述预设关键词集合是由各个具有绿色属性,且与数字资产相关的关键词构成的集合。5.根据权利要求1

3中任一项所述的方法,其特征在于,所述基于所述多个数字资产的披露数据,确定所述多个数字资产中的目标数字资产,包括:根据第一数字资产的披露数据,确定所述第一数字资产的所属企业,所述第一数字资产为所述多个数字资产中的任意一个;确定所述所属企业的所属行业;若所述所属行业为预设行业集合中的行业,则确定所述第一数字资产为所述目标数字资产,其中,所述预设行业集合是由各个具有绿色属性的行...

【专利技术属性】
技术研发人员:诸世卓邵熹闻心远
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1