数字资产中的绿色资产的占比的识别方法及相关产品技术

技术编号:31808743 阅读:27 留言:0更新日期:2022-01-08 11:11
本申请涉及人工智能技术领域,具体涉及一种数字资产中的绿色资产的占比的识别方法及相关产品,该方法包括:对获取到的待识别数字资产的持仓数据进行文本识别,得到多个第一数字资产和第二数字资产;根据各第一数字资产的资产信息,得到至少一个第一文本段;确定各第一文本段分别与多个第二文本段之间的相似度;根据各第一文本段分别与多个第二文本段之间的相似度,确定目标第一文本段;根据目标第一文本段所描述的资产分布,确定各第一数字资产中的绿色资产的占比;根据各第一数字资产中的绿色资产的占比以及第二数字资产中的绿色资产的占比,确定待识别数字资产中的绿色资产的占比。占比。占比。

【技术实现步骤摘要】
数字资产中的绿色资产的占比的识别方法及相关产品


[0001]本申请涉及人工智能
,具体涉及一种数字资产中的绿色资产的占比的识别方法及相关产品。

技术介绍

[0002]在全球气候变化合作的大背景下,各个管理部门需要厘清在自己管辖范围内的绿色和非绿色资产规模,以便更加科学的部署碳达峰和碳中和的实现路径。
[0003]投资机构在实现碳达峰和碳中和的过程中扮演着非常重要的角色,其投资标的的选择实际上将引导企业向绿色产业和碳中和达标的方向发展。
[0004]投资机构在统计其绿色投资比例时,由于监管和保密的需要,不能进行跨部门共享,都是由各个部门进行人工统计,主观性较强,精度低。

技术实现思路

[0005]本申请实施例提供了一种数字资产中的绿色资产的占比的识别方法及相关产品,提高对数字资产中的绿色资产的占比的识别精度。
[0006]第一方面,本申请实施例提供一种基于文本识别的数字资产中的绿色资产的占比的识别方法,包括:对获取到的待识别数字资产的持仓数据进行文本识别,得到多个第一数字资产和第二数字资产,其中,所述本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于文本识别的数字资产中的绿色资产的占比的识别方法,其特征在于,包括:对获取到的待识别数字资产的持仓数据进行文本识别,得到多个第一数字资产和第二数字资产,其中,所述持仓数据中披露了各所述第一数字资产的资产信息,所述持仓数据中未披露所述第二数字资产的资产信息;根据各所述第一数字资产的资产信息,获取各所述第一数字资产的披露数据,并将各所述第一数字资产的披露数据输入到机器阅读理解模型进行文本分割,得到至少一个第一文本段,其中,所述至少一个第一文本段用于描述各所述第一数字资产的资产分布;根据相似度模型,确定各所述第一文本段分别与多个第二文本段之间的相似度,其中,所述多个第二文本段用于描述多个具有绿色属性的资金分布;根据各所述第一文本段分别与所述多个第二文本段之间的相似度,确定所述至少一个第一文本段中的目标第一文本段;根据所述目标第一文本段所描述的资产分布,以及各所述第一数字资产的总金额,确定各所述第一数字资产中的绿色资产的占比;根据所述待识别数字资产的管理者的画像,获取所述管理者管理的所有数字资产,并获取所述所有数字资产中披露了资产信息的数字资产中的绿色资产的平均占比,并将所述平均占比作为所述第二数字资产中的绿色资产的占比;根据各所述第一数字资产中的绿色资产的占比以及所述第二数字资产中的绿色资产的占比,确定所述待识别数字资产中的绿色资产的占比。2.根据权利要求1所述的方法,其特征在于,当各所述第一数字资产的披露数据为各所述第一数字资产的所属企业的年报时,各所述第一数字资产的资产分布为各所述第一数字资产所属企业的子产品的占比,各所述第二文本段所描述的资金分布为具有绿色属性的产品;所述将各所述第一数字资产的披露数据输入到机器阅读理解模型进行文本分割,得到至少一个第一文本段,包括:对所述年报进行文本识别,得到所述年报中的目标章节,其中,所述目标章节用于描述各所述第一数字资产的所属企业的主营产品,且所述目标章节包括目标表格和目标文本段;将所述目标文本段输入到机器阅读理解模型进行文本分割,得到所述至少一个第一文本段,各所述第一文本段用于描述所述主营产品的一个子产品;所述根据所述目标第一文本段所描述的资产分布,以及各所述第一数字资产的总金额,确定各所述第一数字资产中的绿色资产的占比,包括:对所述目标文本段和所述目标表格均进行实体识别,得到所述主营产品的占比,其中,所述主营产品的占比为所述主营产品的营业额与所述所属企业的总营业额的比值;根据所述主营产品的占比,确定所述主营产品中的各子产品的占比;根据各所述子产品的占比,确定所述目标第一文本段描述的子产品的占比;根据所述目标第一文本段描述的子产品的占比,确定各所述第一数字资产中的绿色资产的占比。3.根据权利要求1或2所述的方法,其特征在于,根据相似度模型,确定各所述第一文本段分别与多个第二文本段之间的相似度之前,所述方法还包括:
获取第一预设文档,所述第一预设文档中记载的产品均具有绿色属性;对所述第一预设文档进行文本识别,得到多个第三文本段,其中,所述多个第三文本段用于描述所述第一预设文档中记载的产品;若所述多个第三文本段中的任意一个第三文本段引用其他文档,则对所述其他文档进行文本识别,得到与所述任意一个第三文本段对应的第四文本段,其中,所述第四文本段是所述其他文档中用于描述具有绿色属性的产品的文本;将所述多个第三文本段和所述所述任意一个第三文本段对应的第四文本段作为所述多个第二文本段;分别对所述多个第二文本段中的每个第二文本段进行实体提取,得到多个目标实体;将所述多个第二文本段中的任意一个第二文本段以及从所述任意一个第二文本段中提取出的目标实体作为一对训练样本,得到多对第一训练样本;从所述多个目标实体中除所述任意一个第二文本段对应的目标实体之外的其他目标实体中随机选择一个目标实体,并将随机选择的目标实体与所述任意一个第二文本段作为一对训练样本,得到多对第二训练样本;将所述多对第一训练样本和所述多对第二训练样本作为多对目标训练样本;根据所述多对目标训练样本对初始模型进行训练,得到所述相似度模型。4.根据权利要求1所述的方法,其特征在于,当各所述第一数字资产的资产分布为各所述第一数字资产的资金用途时,各所述第二文本段描述的资金分布为具有绿色属性的资金用途;所述根据相似度模型,确定各所述第一文本段分别与多个第二文本段之间的相似度,包括:将各所述第一文本段输入到语义信息提取模型进行语义信息提取,得到各所述第一文本段的第一特征向量;将各所述第二文本段输入到所述语义信息提取模型进行语义信息提取,得到所述各所述第二文本段的第二特征向量;根据各所述第一文本段的第一特征向量以及各所述第二文本段的第二特征向量,确定各所述第一文本段分别与多个第二文本段的相似度;所述根据所述目标第一文本段所描述的资产分布,以及各所述第一数字资产的总金额,确定各所述第一数字资产中的绿色资产的占比,包括:将所述目标第一文本段所描述的资金用途中规划的资金金额与各所述第一数字资产的总金额的比例,作为各所述第一数字资产中的绿色资产的占比。5.根据权利要求1

4中任一项所述的方法,其特征在于,所述根据各所述第一数字资产中的绿色资产的占比、以及所述第二数字资产中的绿色资产的占比,确定所述待识别数字资产中的绿色资产的占比,包括:获取各所述第一数字资产的净值相对于所述待识别数...

【专利技术属性】
技术研发人员:诸世卓崔伟旗刘琛
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1