风险识别方法及装置制造方法及图纸

技术编号:19779624 阅读:27 留言:0更新日期:2018-12-15 11:46
本发明专利技术实施例提出了一种风险识别方法及装置,该方法包括:获取客户的基础数据和账户的基础数据;根据客户的基础数据和账户的基础数据构建金融交易关系网络;根据金融交易关系网络及节点的类型,定义多个元路径模式;根据多个元路径模式及属性基础数据,计算目标实体在金融交易关系网络中的特征表示;根据关系网络特征向量以及样本数据,形成训练数据集;根据训练数据集,使用机器学习法训练并确定风险评估模型;计算查询对象的特征表示、风险评估模型,计算查询对象的风险评分。

【技术实现步骤摘要】
风险识别方法及装置
本专利技术涉及机器学习领域,尤其涉及一种基于机器学习的风险识别系统与方法。
技术介绍
随着互联网和移动通讯技术的快速发展,网上交易呈现爆发式增长,线上渠道给客户带来了巨大便利,同时线上欺诈风险也急速加剧。当前欺诈风险识别系统主要通过业务规则引擎和模型引擎相结合的手段进行评估。但是,目前模型引擎主要基于个体行为和属性,如单个客户或账户的交易行为、单个客户的画像信息。随着大数据不断增长,以及数据内部依赖、复杂程度的不断增加,网络关系无处不在,如个人社交网络、交通网络、企业关系网、账户交易网络、个人信息网络。个体的行为和属性已经难以表达数据内部隐藏的特征,如账户A和B预留了同一个手机号,如果A为风险客户,仅考虑B的个体行为很难发现其为风险客户。因此,目前基于个体行为和属性的欺诈风险识别系统,明显存在较大风险隐患。而个体之间的各种网络关系又极其复杂,信息量非常大,现有信息系统无法完成,人工处理更是不可能完成。
技术实现思路
为了解决现有交易中欺诈风险的识别问题,本专利技术提出了一种风险识别方法及装置,以提高欺诈风险的识别能力。本专利技术实施例的一种风险识别方法,包括:获取客户的基础数据和账户的基础数据,所述基础数据包括基本属性和行为数据;根据所述客户的基础数据和账户的基础数据构建金融交易关系网络,所述金融交易关系网络为基于图的数据结构,包括:节点、边,所述节点为所述基础数据中的实体,所述边为所述节点间的所述实体的关系;根据金融交易关系网络及所述节点的类型,定义多个元路径模式;根据所述多个元路径模式及所述属性基础数据,计算所述目标实体在金融交易关系网络中的特征表示;根据所述关系网络以及样本数据,形成训练数据集;根据所述训练数据集,使用机器学习法训练并确定风险评估模型;计算查询对象的特征表示、所述风险评估模型,计算所述查询对象的风险评分。进一步的,所述获取客户的基础数据和账户的基础数据的步骤之后,包括:清洗所述客户的基础数据和账户的基础数据。进一步的,所述金融交易关系网络采用图计算引擎计算获得,并采用图数据库或关系型数据库存储,所述图计算引擎包括Graphx,所述图数据库包括Neo4j。进一步的,所述元路径模式包括:账户-客户-账户模式、账户-客户-手机号-客户-账户模式、账户-客户-地址-客户-账户模式、账户-IP-账户模式、账户-设备-账户模式、账户-账户模式。进一步的,所述根据所述多个元路径模式及所述属性基础数据,计算所述目标实体在金融交易关系网络中的特征表示,包括:根据所述多个元路径模式及所述属性基础数据,计算图关系特征表示、图结构特征表示、个性特征表示;汇总所述图关系特征表示、图结构特征表示、个性特征表示,生成所述目标实体在金融交易关系网络中的特征表示。进一步的,所述根据所述多个元路径模式及所述属性基础数据,计算图关系特征表示、图结构特征表示、个性特征表示的步骤包括:计算每个所述节点与已知所有风险节点在所述多个元路径模式下的相似性度量,确定其中最大值作为所述图关系特征表示,相似性度量计算方法包括:Pathsim相似性、余弦相似性、Euclidean距离、Pearson相关系数。进一步的,所述根据所述多个元路径模式及所述属性基础数据,计算图关系特征表示、图结构特征表示、个性特征表示的步骤包括:计算每个所述节点在所述金融交易关系网络中的度中心性、聚集系数作为所述图结构特征表示。进一步的,所述根据所述多个元路径模式及所述属性基础数据,计算图关系特征表示、图结构特征表示、个性特征表示的步骤包括:确定每个所述节点的行为信息、属性信息作为个性特征表示,所述行为信息包括:某段时间的最大交易额、最小交易额,所述属性信息包括:是否为贵金属客户、是否为理财金账户、是否为代发工资客户、性别、年龄、开户时长。进一步的,所述根据所述训练数据集,使用机器学习法训练并确定风险评估模型的步骤中,所述机器学习法包括:梯度提升决策树算法、逻辑回归算法、随机森林算法、神经网络算法。为了达到上述目的,本专利技术实施例还提出了一种风险识别装置,包括:基础数据获取模块,用于获取客户的基础数据和账户的基础数据,所述基础数据包括基本属性和行为数据;网络构建模块,用于根据所述客户的基础数据和账户的基础数据构建金融交易关系网络,所述金融交易关系网络为基于图的数据结构,包括:节点、边,所述节点为所述基础数据中的实体,所述边为所述节点间的所述实体的关系;元路径定义模块,用于根据金融交易关系网络及所述节点的类型,定义多个元路径模式;特征表示计算模块,用于根据所述多个元路径模式及所述属性基础数据,计算所述目标实体在金融交易关系网络中的特征表示;数据集形成模块,用于根据所述关系网络以及样本数据,形成训练数据集;评估模型确定模块,用于根据所述训练数据集,使用机器学习法训练并确定风险评估模型;风险评分计算模块,用于计算查询对象的特征表示、所述风险评估模型,计算所述查询对象的风险评分。进一步的,还包括:数据清洗模块,用于清洗所述客户的基础数据和账户的基础数据。进一步的,所述网络构建模块的所述金融交易关系网络采用图计算引擎计算获得,并采用图数据库或关系型数据库存储,所述图计算引擎包括Graphx,所述图数据库包括Neo4j。进一步的,所述元路径定义模块的所述元路径模式包括:账户-客户-账户模式、账户-客户-手机号-客户-账户模式、账户-客户-地址-客户-账户模式、账户-IP-账户模式、账户-设备-账户模式、账户-账户模式。进一步的,所述特征表示计算模块,包括:特征表示计算单元,用于根据所述多个元路径模式及所述属性基础数据,计算图关系特征表示、图结构特征表示、个性特征表示;特征表示汇总单元,用于汇总所述图关系特征表示、图结构特征表示、个性特征表示,生成所述目标实体在金融交易关系网络中的特征表示。进一步的,所述特征表示计算单元包括:图关系特征表示计算单元,用于计算每个所述节点与已知所有风险节点在所述多个元路径模式下的相似性度量,确定其中最大值作为所述图关系特征表示,相似性度量计算方法包括:Pathsim相似性、余弦相似性、Euclidean距离、Pearson相关系数。进一步的,所述特征表示计算单元包括:图结构特征表示计算单元,用于计算每个所述节点在所述金融交易关系网络中的度中心性、聚集系数作为所述图结构特征表示。进一步的,所述特征表示计算单元包括:个性特征确定单元,用于确定每个所述节点的行为信息、属性信息作为个性特征表示,所述行为信息包括:某段时间的最大交易额、最小交易额,所述属性信息包括:是否为贵金属客户、是否为理财金账户、是否为代发工资客户、性别、年龄、开户时长。进一步的,所述评估模型确定模块的所述机器学习法包括:梯度提升决策树算法、逻辑回归算法、随机森林算法、神经网络算法。为了达到上述目的,本专利技术实施例还提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取客户的基础数据和账户的基础数据,所述基础数据包括基本属性和行为数据;根据所述客户的基础数据和账户的基础数据构建金融交易关系网络,所述金融交易关系网络为基于图的数据结构,包括:节点、边,所述节点为所述基础数据中的实体,所述本文档来自技高网...

【技术保护点】
1.一种风险识别方法,其特征在于,包括:获取客户的基础数据和账户的基础数据,所述基础数据包括基本属性和行为数据;根据所述客户的基础数据和账户的基础数据构建金融交易关系网络,所述金融交易关系网络为基于图的数据结构,包括:节点、边,所述节点为所述基础数据中的实体,所述边为所述节点间的所述实体的关系;根据金融交易关系网络及所述节点的类型,定义多个元路径模式;根据所述多个元路径模式及所述属性基础数据,计算目标实体在金融交易关系网络中的特征表示;根据所述关系网络特征向量以及样本数据,形成训练数据集;根据所述训练数据集,使用机器学习法训练并确定风险评估模型;计算查询对象的特征表示、所述风险评估模型,计算所述查询对象的风险评分。

【技术特征摘要】
1.一种风险识别方法,其特征在于,包括:获取客户的基础数据和账户的基础数据,所述基础数据包括基本属性和行为数据;根据所述客户的基础数据和账户的基础数据构建金融交易关系网络,所述金融交易关系网络为基于图的数据结构,包括:节点、边,所述节点为所述基础数据中的实体,所述边为所述节点间的所述实体的关系;根据金融交易关系网络及所述节点的类型,定义多个元路径模式;根据所述多个元路径模式及所述属性基础数据,计算目标实体在金融交易关系网络中的特征表示;根据所述关系网络特征向量以及样本数据,形成训练数据集;根据所述训练数据集,使用机器学习法训练并确定风险评估模型;计算查询对象的特征表示、所述风险评估模型,计算所述查询对象的风险评分。2.根据权利要求1所述的风险识别方法,其特征在于,所述根据所述多个元路径模式及所述属性基础数据,计算所述目标实体在金融交易关系网络中的特征表示,包括:根据所述多个元路径模式及所述属性基础数据,计算图关系特征表示、图结构特征表示、个性特征表示;汇总所述图关系特征表示、图结构特征表示、个性特征表示,生成所述目标对象在金融交易关系网络中的特征表示。3.根据权利要求2所述的风险识别方法,其特征在于,所述根据所述多个元路径模式及所述属性基础数据,计算图关系特征表示、图结构特征表示、个性特征表示的步骤包括:计算每个所述节点与已知所有风险节点在所述多个元路径模式下的相似性度量,确定其中最大值作为所述图关系特征表示,相似性度量计算方法包括:Pathsim相似性、余弦相似性、Euclidean距离、Pearson相关系数。4.根据权利要求2所述的风险识别方法,其特征在于,根据所述多个元路径模式及所述属性基础数据,计算图关系特征表示、图结构特征表示、个性特征表示的步骤包括:计算每个所述节点在所述金融交易关系网络中的度中心性、聚集系数作为所述图结构特征表示。5.根据权利要求2所述的风险识别方法,其特征在于,所述根据所述多个元路径模式及所述属性基础数据,计算图关系特征表示、图结构特征表示、个性特征表示的步骤包括:确定每个所述节点的行为信息、属性信息作为个性特征表示,所述行为信息包括:某段时间的最大交易额、最小交易额,所述属性信息包括:是否为贵金属客户、是否为理财金账户、是否为代发工资客户、性...

【专利技术属性】
技术研发人员:贾玉红仲海港张宝华黄炳游枫
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1