企业的评估处理方法、装置及电子设备制造方法及图纸

技术编号:35333890 阅读:17 留言:0更新日期:2022-10-26 11:53
本申请提供一种企业的评估处理方法、装置及电子设备,涉及知识图谱技术领域。该企业的评估处理方法,服务器将文本长度大于预设的长度阈值的第一文本划分为多个子文本,并确定各子文本与预设的第二文本的语义匹配度。这样一来,可以使得第一文本中的所有内容与第二文本进行语义匹配。这样一来,使得对得到的各语义匹配度加权求和,得到第一文本与第二文本的第一相似度的可靠性高。进而,服务器根据第一相似度对企业进行分类,得到企业的类别的精确度高,评估处理的结果的可靠性也高,并且无需人工操作,提高了对企业的评估处理的效率。提高了对企业的评估处理的效率。提高了对企业的评估处理的效率。

【技术实现步骤摘要】
企业的评估处理方法、装置及电子设备


[0001]本申请涉及知识图谱
,尤其涉及一种企业的评估处理方法、装置及电子设备。

技术介绍

[0002]绿色企业是指其经营活动有利于支持环境改善、适应或减缓气候变化和资源节约高效利用、且有资金需求的企业。
[0003]通常地,在银行对某一企业进行信用贷款之前,该企业是否为绿色企业是进行信用贷款的风险评估的重要指标之一。因此,需要对企业进行分类,以评估该企业是否为绿色企业。
[0004]目前,主要是通过人工对企业提供的人工资料进行审核,以判断该企业是否为绿色企业,效率和准确度都比较低。这样一来,导致企业的评估处理的结果的可靠性也低。

技术实现思路

[0005]本申请提供一种企业的评估处理方法、装置及电子设备,用以解决识别企业是否为绿色企业,效率和准确度都比较低的问题。
[0006]第一方面,本申请提供了一种企业的评估处理方法,应用于服务器,包括:服务器获取评估请求,评估请求中包括待评估的企业;根据评估请求,获取与待评估的企业的第一文本,其中,第一文本用于指示企业的经营范围,第一文本的文本长度大于预设的长度阈值;服务器将第一文本划分为多个子文本,并确定各子文本与预设的第二文本的语义匹配度,其中,子文本的文本长度小于长度阈值,第二文本为包含有描述绿色企业的关键词的文本;服务器对各语义匹配度加权求和,获取第一文本与第二文本的第一相似度;服务器根据第一相似度,确定待评估的企业的类别,其中,企业的类别为绿色企业或非绿色企业;服务器根据获取的与待评估的企业的类别对应的评估模式,对待评估的企业进行评估处理。
[0007]在一种可选地实施方式中,在服务器根据第一相似度,确定待评估的企业的类别之前,方法还包括:服务器将第一文本与第二文本的进行关键词匹配,得到第一文本与第二文本的第二相似度;则服务器根据第一相似度,确定待评估的企业的类别,包括:服务器对第一相似度和第二相似度进行加权求和,以确定第一文本与第二文本的第三相似度;服务器根据第三相似度,确定待评估的企业的类别。
[0008]可以理解地,由于第三相似度是根据对第一相似度和第二相似度进行加权求和得到的,而第二相似度又是将第一文本与第二文本的进行关键词匹配得到的。如此,服务器根据第三相似度对企业进行分类,得到企业的类别的可靠性更高。
[0009]在一种可选地实施方式中,服务器对第一相似度和第二相似度进行加权求和,以确定第一文本与第二文本的第三相似度,包括:服务器根据第一相似度和第二
相似度S
doc
,采用公式:,以确定第一文本与第二文本的第三相似度Score
d
;其中,a为第一权重,且a为取值范围为[0,1],为第二权重,的取值范围为[0,1],为语义匹配度,n为子文本的数量;i为正整数。
[0010]在一种可选地实施方式中,在服务器根据第一相似度对企业进行分类,得到企业的类别之前,方法还包括:服务器获取企业的第三文本,其中,第三文本用于描述企业的专利信息;服务器从第三文本中提取出第一实体向量集合;服务器对第一实体向量集合中的各第一实体进行同义词泛化,得到第二实体向量集合;服务器根据第一相似度,确定待评估的企业的类别,包括:服务器将第一相似度和第二实体向量集合构成的待识别文本,并采用预训练的分类模型对待识别文本进行分类,并根据待识别文本的分类结果,确定待评估的企业的类别。
[0011]由于第二实体向量集合是对第一实体向量集合中的各第一实体进行泛化得到的,且第一实体向量集合是从用于描述企业的专利信息的第三文本中提取的。如此,对第一相似度和第二实体向量集合构成的待识别文本进行分类,得到企业的类别的可靠性更高。
[0012]在一种可选地实施方式中,分类模型是采用获取的待训练的输入数据,以及输出数据,对初始的待训练网络进行训练得到的;其中,输入数据为多个历史待识别文本,输出数据为多个历史待识别文本的类别。
[0013]在一种可选地实施方式中,第三文本包括专利名称,服务器对第一实体向量集合中的每个关键词进行同义词泛化,得到第二实体向量集合,包括:服务器对第三文本中的专利名称进行向量化,并提取第一实体向量集合;服务器查找出第一实体向量集合中的各第一实体向量的语义相近的实体向量A;服务器查找出各实体向量A的语义相近的实体向量B;服务器计算第一实体向量集合、实体向量A的集合以及实体向量B的集合中,各语义相近的实体向量的平均值向量,得到第二实体向量集合。
[0014]在一种可选地实施方式中,服务器对第一实体向量集合中的每个关键词进行同义词泛化,得到第二实体向量集合,包括:服务器将第三文本进行向量化,并提取第一实体向量集合;服务器根据TransR算法,从预设的知识图谱中查找出第一实体向量集合中的各第一实体的语义相近的实体向量A;服务器将第一实体向量集合、实体向量A的集合的并集,作为第二实体向量集合。
[0015]第二方面,本申请还提供了一种企业的评估处理装置,应用于服务器,包括:请求获取单元,用于获取的评估请求,评估请求中包括待评估的企业;文本获取单元,用于根据评估请求,获取与待评估的企业的第一文本,其中,第一文本用于指示企业的经营范围,第一文本的文本长度大于预设的长度阈值;语义匹配单元,用于将第一文本划分为多个子文本,并确定各子文本与预设的第二文本的语义匹配度,其中,子文本的文本长度小于长度阈值,第二文本为包含有描述绿色企业的关键词的文本;相似度计算单元,用于对各语义匹配度加权求和,获取第一文本与第二文本的第一相似度;企业分类单元,用于根据第一相似度,确定待评估的企业的类别,其中,企业的类别为绿色企业或非绿色企业;企业评估单元,用于根据获取的与待评估的企业的类别对应的评估模式,对待评估的企业进行评估处理。
[0016]第三方面,本申请还提供一种电子设备,包括存储器、处理器以及存储在存储器中
并可在处理器上运行的计算机程序,处理器执行计算机程序时,使得电子设备执行如本申请第一方面提供的方法。
[0017]第四方面,本申请还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时,使得计算机执行如本申请第一方面提供的方法。
[0018]第五方面,本申请还提供一种计算机程序产品,包括计算机程序,当计算机程序被运行时,使得计算机执行如本申请第一方面提供的方法。
[0019]本申请提供的一种企业的评估处理方法,服务器将文本长度大于预设的长度阈值的第一文本划分为多个子文本,并确定各子文本与预设的第二文本的语义匹配度。这样一来,可以使得第一文本中的所有内容与第二文本进行语义匹配。这样一来,使得对得到的各语义匹配度加权求和,得到第一文本与第二文本的第一相似度的可靠性高。进而,服务器根据第一相似度对企业进行分类,得到企业的类别的精确度高,评估处理的结果的可靠性也高,并且无需人工操作,提高了对企业的评估处理的效率和准确度。
附图说明
[0020]此处的附图被并入说明书中并本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种企业的评估处理方法,其特征在于,应用于服务器,所述方法包括:所述服务器获取评估请求,所述评估请求中包括待评估的企业;根据所述评估请求,获取与所述待评估的企业的第一文本,其中,所述第一文本用于指示所述企业的经营范围,所述第一文本的文本长度大于预设的长度阈值;所述服务器将所述第一文本划分为多个子文本,并确定各所述子文本与预设的第二文本的语义匹配度,其中,所述子文本的文本长度小于所述长度阈值,所述第二文本为包含有描述绿色企业的关键词的文本;所述服务器对各所述语义匹配度加权求和,获取所述第一文本与所述第二文本的第一相似度;所述服务器根据所述第一相似度,确定所述待评估的企业的类别,其中,所述企业的类别为绿色企业或非绿色企业;所述服务器根据获取的与所述待评估的企业的类别对应的评估模式,对所述待评估的企业进行评估处理。2.根据权利要求1所述的方法,其特征在于,在所述服务器根据所述第一相似度,确定所述待评估的企业的类别之前,所述方法还包括:所述服务器将所述第一文本与所述第二文本进行关键词匹配,得到所述第一文本与所述第二文本的第二相似度;则所述服务器根据所述第一相似度,确定所述待评估的企业的类别,包括:所述服务器对所述第一相似度和所述第二相似度进行加权求和,以确定所述第一文本与所述第二文本的第三相似度;所述服务器根据所述第三相似度,确定所述待评估的企业的类别。3.根据权利要求2所述的方法,其特征在于,所述服务器对所述第一相似度和所述第二相似度进行加权求和,以确定所述第一文本与所述第二文本的第三相似度,包括:所述服务器根据所述第一相似度和所述第二相似度S
doc
,采用公式:,以确定所述第一文本与所述第二文本的第三相似度Score
d
;其中,a为第一权重,且a为取值范围为[0,1],为第二权重,的取值范围为[0,1],为语义匹配度,n为所述子文本的数量;i为正整数。4.根据权利要求1

3任一所述的方法,其特征在于,在所述服务器根据所述第一相似度对所述企业进行分类,得到所述企业的类别之前,所述方法还包括:所述服务器获取企业的第三文本,其中,所述第三文本用于描述所述企业的专利信息;所述服务器从所述第三文本中提取出第一实体向量集合;所述服务器对所述第一实体向量集合中的各第一实体进行同义词泛化,得到第二实体向量集合;所述服务器根据所述第一相似度,确定所述待评估的企业的类别,包括:
所述服务器将所述第一相似度和所述第二实体向量集合构成的待识别文本,并采用预训练的分类模型对所述待识别文本进行分类,并根据所述待识别文本的分类结果,确定所述待评估的企业的类别。5.根据权利要求4所述的方法,其特征在于,所述分类模型是采用获取的待训练...

【专利技术属性】
技术研发人员:陈达纲张晨王婷玉李昱王全礼张圳蒲柯锐
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1