实体特征样本生成方法及装置、实体信用预测方法及装置制造方法及图纸

技术编号:22565930 阅读:22 留言:0更新日期:2019-11-16 12:23
本公开提供了一种实体特征样本生成方法及装置、实体信用预测方法及装置。实体特征样本生成方法包括:基于目标实体与至少一个关联实体中的各个关联实体的各个关联关系类别向量,利用第一机器学习模型,生成特征权重矩阵;基于所述各个关联实体的关联实体属性特征向量,生成关联实体属性特征矩阵;以及基于所述特征权重矩阵和所述关联实体属性特征矩阵,生成目标实体的实体特征样本。

Methods and devices for generating entity feature samples, methods and devices for predicting entity credit

The present disclosure provides an entity feature sample generation method and device, entity credit prediction method and device. The method of generating entity feature samples includes: generating feature weight matrix by using the first machine learning model based on the category vector of each association relationship between the target entity and each association entity in at least one association entity; generating the attribute feature matrix of the association entity based on the attribute feature vector of the association entity of each association entity; and generating the attribute feature matrix of the association entity based on the attribute weight matrix and The associated entity attribute feature matrix generates entity feature samples of the target entity.

【技术实现步骤摘要】
实体特征样本生成方法及装置、实体信用预测方法及装置
本公开涉及计算机
,具体地,涉及实体特征样本生成方法及装置、实体信用预测方法及装置。
技术介绍
信用在日常生活中的地位越来越突出。与此同时,准确地对自然人或企业等实体进行信息评估也越来越重要。当信用评估不准确时,会为其他实体或社会大众带来重大损失。因此,现有技术亟需一种能够准确地评估实体信用的方案。
技术实现思路
鉴于上述,本公开提供了一种实体特征样本生成方法及装置、实体信用预测方法及装置。利用本公开的方法及装置,能够在预测实体信用时考虑关联实体的关联风险因素,并且信用预测过程采用注意力机制,从而使得信用预测过程有区别地关注各项关联风险因素,从而使得信用预测更加准确。根据本公开的一个方面,提供了一种用于生成实体特征样本的方法,所述方法包括:基于目标实体与至少一个关联实体中的各个关联实体的各个关联关系类别向量,利用第一机器学习模型,生成特征权重矩阵;基于所述各个关联实体的关联实体属性特征向量,生成关联实体属性特征矩阵;以及基于所述特征权重矩阵和所述关联实体属性特征矩阵,生成目标实体的实体特征样本。可选地,在一个示例中,所述关联实体属性特征矩阵与所述特征权重矩阵具有相同的维度,基于所述特征权重矩阵和所述关联实体属性特征矩阵,生成目标实体的实体特征样本可以包括:将所述关联实体属性特征矩阵与所述特征权重矩阵进行点乘运算,以得出加权特征矩阵;以及基于所述加权特征矩阵中各个列,生成对应于该列的维度值,以生成目标实体的实体特征向量来作为所述实体特征样本。可选地,在一个示例中,基于所述各个关联实体的关联实体属性特征向量,生成关联实体属性特征矩阵可以包括:当所述关联实体属性特征向量的维度低于所述特征权重矩阵的维度时,基于所述各个关联实体的关联实体属性特征向量中的至少一个维度,确定出该关联实体属性特征向量的至少一个补充维度值,以使所生成的关联实体属性特征矩阵与所述特征权重矩阵具有相同的维度。可选地,在一个示例中,基于所述各个关联实体的关联实体属性特征向量,生成关联实体属性特征矩阵可以包括:基于所述各个关联实体的关联实体属性特征向量,利用第二机器学习模型来生成所述关联实体属性特征矩阵。可选地,在一个示例中,所述目标实体可以包括多个,针对多个目标实体的第一机器学习模型的模型参数可以是相同的。可选地,在一个示例中,所述第一机器学习模型和/或所述第二机器学习模型可以基于神经网络模型实现。可选地,在一个示例中,所述各个关联实体的关联实体属性特征向量可以基于该关联实体与所述目标实体的各个关联关系类别的关联关系类别属性和该关联实体的实体属性生成。可选地,在一个示例中,所述实体属性可以包括以下中的至少一者:投资比例、纠纷关系类别、关联关系准确度、相应关联关系类别的统计值。所述实体属性包括以下中的至少一者:实体经营状态、实体信用评分、实体交易信息、实体信息用记录、实体类别。可选地,在一个示例中,所述目标实体包括目标企业,所述关联实体包括关联企业和/或关联自然人,所述关联实体与所述目标实体之间的关联关系类别可以包括以下中的至少一者:任职所属关系、投资关联关系、交易往来关系、纠纷关联关系、担保关联关系、契约关联关系、人际关联关系。根据本公开的另一方面,还提供一种确定待预测实体信用的方法,包括:基于待预测实体的实体特征样本,利用信用预测模型来预测所述待预测实体的实体信用,其中,所述待预测实体的实体特征样本利用如上所述的实体特征样本生成方法生成,所述信用预测模型利用至少一个带标记实体特征样本训练得到,所述至少一个带标记实体特征样本利用如上所述的实体特征样本生成方法生成。可选地,在一个示例中,所述待预测实体可以包括企业和/或自然人。根据本公开的另一方面,还提供一种用于生成实体特征样本的装置,所述装置可以包括:权重矩阵生成单元,基于目标实体与至少一个关联实体中的各个关联实体的各个关联关系类别向量,利用第一机器学习模型,生成特征权重矩阵;特征矩阵生成单元,基于所述各个关联实体的关联实体属性特征向量,生成关联实体属性特征矩阵;以及特征样本生成单元,基于所述特征权重矩阵和所述关联实体属性特征矩阵,生成目标实体的实体特征样本。可选地,在一个示例中,所述关联实体属性特征矩阵与所述特征权重矩阵具有相同的维度,所述特征样本生成单元可以包括:加权特征矩阵确定模块,将所述关联实体属性特征矩阵与所述特征权重矩阵进行点乘运算,以得出加权特征矩阵;以及特征样本生成模块,基于所述加权特征矩阵中各个列,生成对应于该列的维度值,以生成目标实体的实体特征向量来作为所述实体特征样本。可选地,在一个示例中,所述特征矩阵生成单元可以当所述关联实体属性特征向量的维度低于所述特征权重矩阵的维度时,基于所述各个关联实体的关联实体属性特征向量中的至少一个维度,确定出该关联实体属性特征向量的至少一个补充维度值,以使所生成的关联实体属性特征矩阵与所述特征权重矩阵具有相同的维度。可选地,在一个示例中,所述关联实体属性特征矩阵生成单元可以基于所述各个关联实体的关联实体属性特征向量,利用第二机器学习模型来生成所述关联实体属性特征矩阵。可选地,在一个示例中,所述目标实体可以包括多个,针对多个目标实体的第一机器学习模型的模型参数可以是相同的。根据本公开的另一方面,还提供一种确定待预测实体信用的装置,包括:实体信用预测单元,基于待预测实体的实体特征样本,利用信用预测模型来预测所述待预测实体的实体信用,其中,所述待预测实体的实体特征样本利用如上所述的实体特征样本生成方法生成,所述信用预测模型利用至少一个带标记实体特征样本训练得到,所述至少一个带标记实体特征样本利用如上所述实体特征样本生成的方法生成。根据本公开的另一方面,还提供一种计算设备,包括:至少一个处理器;以及存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如上所述的实体特征样本生成方法。根据本公开的另一方面,还提供一种非暂时性机器可读存储介质,其存储有可执行指令,所述指令当被执行时使得所述机器执行如上所述的实体特征样本生成方法。根据本公开的另一方面,还提供一种计算设备,包括:至少一个处理器;以及存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如上所述的实体信用预测方法。根据本公开的另一方面,还提供一种非暂时性机器可读存储介质,其存储有可执行指令,所述指令当被执行时使得所述机器执行如上所述的实体信用预测方法。利用本公开的方法和装置,通过基于各个关联关系类别向量生成特征权重矩阵,并基于关联实体属性特征向量生成关联实体属性矩阵,然后基于特征权重矩阵和关联实体属性特征矩阵来生成目标实体的实体特征样本,从而能够采用注意力机制来基于关联实体的关联风险特征来生成目标实体的实体特征样本。采用由此生成的实体特征样本来训练实体信用预测模型,并利用所训练出的信用预测模型来进行实体信用预测时本文档来自技高网...

【技术保护点】
1.一种用于生成实体特征样本的方法,所述方法包括:/n基于目标实体与至少一个关联实体中的各个关联实体的各个关联关系类别向量,利用第一机器学习模型,生成特征权重矩阵;/n基于所述各个关联实体的关联实体属性特征向量,生成关联实体属性特征矩阵;以及/n基于所述特征权重矩阵和所述关联实体属性特征矩阵,生成所述目标实体的实体特征样本。/n

【技术特征摘要】
1.一种用于生成实体特征样本的方法,所述方法包括:
基于目标实体与至少一个关联实体中的各个关联实体的各个关联关系类别向量,利用第一机器学习模型,生成特征权重矩阵;
基于所述各个关联实体的关联实体属性特征向量,生成关联实体属性特征矩阵;以及
基于所述特征权重矩阵和所述关联实体属性特征矩阵,生成所述目标实体的实体特征样本。


2.如权利要求1所述的方法,其中,所述关联实体属性特征矩阵与所述特征权重矩阵具有相同的维度,基于所述特征权重矩阵和所述关联实体属性特征矩阵,生成目标实体的实体特征样本包括:
将所述关联实体属性特征矩阵与所述特征权重矩阵进行点乘运算,以得出加权特征矩阵;以及
基于所述加权特征矩阵中各个列,生成对应于该列的维度值,以生成所述目标实体的实体特征向量来作为所述实体特征样本。


3.如权利要求2所述的方法,其中,基于所述各个关联实体的关联实体属性特征向量,生成关联实体属性特征矩阵包括:
当所述关联实体属性特征向量的维度低于所述特征权重矩阵的维度时,基于所述各个关联实体的关联实体属性特征向量中的至少一个维度,确定出该关联实体属性特征向量的至少一个补充维度值,以使所生成的关联实体属性特征矩阵与所述特征权重矩阵具有相同的维度。


4.如权利要求1或2所述的方法,其中,基于所述各个关联实体的关联实体属性特征向量,生成关联实体属性特征矩阵包括:
基于所述各个关联实体的关联实体属性特征向量,利用第二机器学习模型来生成所述关联实体属性特征矩阵。


5.如权利要求1-3中任一项所述的方法,其中,所述目标实体包括多个,针对多个目标实体的第一机器学习模型的模型参数相同。


6.如权利要求4所述的方法,其中,所述第一机器学习模型和/或所述第二机器学习模型基于神经网络模型实现。


7.如权利要求1-3中任一项所述的方法,其中,所述各个关联实体的关联实体属性特征向量基于该关联实体与所述目标实体的各个关联关系类别的关联关系类别属性和该关联实体的实体属性生成。


8.如权利要求7所述的方法,其中,所述实体属性包括以下中的至少一者:投资比例、纠纷关系类别、关联关系准确度、相应关联关系类别的统计值;
和/或
所述实体属性包括以下中的至少一者:实体经营状态、实体信用评分、实体交易信息、实体信息用记录、实体类别。


9.如权利要求1-3中任一项所述的方法,其中,所述目标实体包括目标企业,所述关联实体包括关联企业和/或关联自然人,所述关联实体与所述目标实体之间的关联关系类别包括以下中的至少一者:任职所属关系、投资关联关系、交易往来关系、纠纷关联关系、担保关联关系、契约关联关系、人际关联关系。


10.一种确定待预测实体信用的方法,包括:
基于待预测实体的实体特征样本,利用信用预测模型来预测所述待预测实体的实体信用,
其中,所述待预测实体的实体特征样本利用如权利要求1-9中任一项所述的方法生成,所述信用预测模型利用至少一个带标记实体特征样本训练得到,所述至少一个带标...

【专利技术属性】
技术研发人员:廖飞洋
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1