一种图神经网络训练方法及装置制造方法及图纸

技术编号：31622020 阅读：36 留言：0更新日期：2021-12-29 18:57

本说明书一个或多个实施例提供一种图神经网络训练方法及装置，获取初始图数据后，计算获取的初始图数据中每两个节点之间的亲密度，亲密度大小反应了两个节点拓扑结构的相似度。通过亲密度大小，针对每个节点，按照亲密度从大到小的顺序，将用于更新该节点的节点构造成输入矩阵，并将每个节点的输入矩阵作为输入，每个节点的风险分类标签作为输出，根据每个节点的风险分类标签，训练图神经网络。这样，根据亲密度来筛选节点，更新节点所考虑的节点不仅局限于一阶邻域的节点，还可以考虑到高阶邻域上的节点，使得节点更新可以考虑全局信息，特征表征更加准确。特征表征更加准确。特征表征更加准确。

全部详细技术资料下载

【技术实现步骤摘要】
一种图神经网络训练方法及装置

[0001]本说明书一个或多个实施例涉及计算机应用
，尤其涉及一种图神经网络训练方法及装置。

技术介绍

[0002]金融风控场景中，为了能更好地识别金融欺诈风险，通常是基于机器学习，来对每条交易数据进行特征表征，再通过训练的分类器来对特征进行分类，从而确定是否存在金融欺诈风险。为了能更好地实现金融欺诈风险的检测，相关技术中通常使用能反映多个交易数据之间关系信息的图神经网络来进行特征表征。图神经网络中的图指的是，由若干个节点和节点之间相连的边组成的具有拓扑结构的图。图神经网络中，每个节点一般代表交易的一方，边一般用于表征两个节点之间的关系，也就是交易双方之间的关系等。
[0003]而目前的图神经网络的训练方法，存在节点更新过程中无法对全局信息进行学习，这使得目前的图神经网络仍无法对样本特征进行有效表征，无法较好排查金融欺诈风险。

技术实现思路

[0004]有鉴于此，本说明书一个或多个实施例提供一种图神经网络训练方法及装置。
[0005]根据本说明书一个或多个实施例的第一方面，提出了一种图神经网络训练方法，所述方法包括：
[0006]获取初始图数据；所述初始图数据为包含若干个节点且具有拓扑结构的图的数据；
[0007]计算所述初始图数据中每两个节点之间的亲密度；所述亲密度的大小与所述亲密度对应的两个节点的拓扑结构相似度正相关；
[0008]针对每个节点i，i＝1,2,3,...N，N为图中的节点总数，构建该节点的输入矩阵H
>i
，其中，输入矩阵的第1列对应于节点i的特征向量，第2～M列分别对应于：与节点i的亲密度由大到小排序的其他M
‑
1个节点的特征向量；M为预设的小于等于N的自然数；
[0009]以每个节点的输入矩阵作为输入，以每个节点的交易风险分类为输出，根据节点对应的交易风险分类标签，训练图神经网络；所述图神经网络用于对每个节点对应的用户的交易风险进行分类。
[0010]根据本说明书一个或多个实施例的第二方面，提出了一种图神经网络训练装置，所述装置包括：
[0011]初始图数据获取模块，用于获取初始图数据；所述初始图数据为包含若干个节点且具有拓扑结构的图的数据；
[0012]亲密度计算模块，用于计算所述初始图数据中每两个节点之间的亲密度；所述亲密度的大小与所述亲密度对应的两个节点的拓扑结构相似度正相关；
[0013]输入矩阵构造模块，用于针对每个节点i，i＝1,2,3,...N，N为图中的节点总数，构
建该节点的输入矩阵Hi，其中，输入矩阵的第1列对应于节点i的特征向量，第2～M列分别对应于：与节点i的亲密度由大到小排序的其他M
‑
1个节点的特征向量；M为预设的小于等于N的自然数；
[0014]图神经网络训练模块，用于以每个节点的输入矩阵作为输入，以每个节点的交易风险分类为输出，根据节点对应的交易风险分类标签，训练图神经网络；所述图神经网络用于对每个节点对应的用户的交易风险进行分类。
[0015]根据本说明书实施例的第三方面，提供一种计算机可读存储介质，其上存储有计算机指令，该指令被处理器执行时实现如本说明书实施例第一方面所述的图神经网络训练方法。
[0016]根据本说明书实施例的第四方面，提供一种电子设备，包括：
[0017]处理器；
[0018]用于存储处理器可执行指令的存储器；
[0019]其中，所述处理器通过运行所述可执行指令以实现如本说明书实施例第一方面所述的图神经网络训练方法。
[0020]本说明书一个或多个实施例提供一种图神经网络训练方法及装置，获取初始图数据后，计算获取的初始图数据中每两个节点之间的亲密度，亲密度大小反应了两个节点拓扑结构的相似度。通过亲密度大小，针对每个节点，按照亲密度从大到小的顺序，将用于更新该节点的节点构造成输入矩阵，并将每个节点的输入矩阵作为输入，每个节点的交易风险的分类标签作为输出，根据每个节点的节点分类标签，训练图神经网络。这样，根据亲密度来筛选节点，更新节点所考虑的节点不仅局限于一阶邻域的节点，还可以考虑到高阶邻域上的节点，使得节点更新可以考虑全局信息，特征表征更加准确。
[0021]应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本说明书。
附图说明
[0022]此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本说明书的实施例，并与说明书一起用于解释本说明书的原理。
[0023]图1是本说明书根据一示例性实施例示出的一种图神经网络训练方法的流程图。
[0024]图2是本说明书根据一具体实施例示出的一种图神经网络训练方法的示意图。
[0025]图3是本说明书根据一示例性实施例示出的一种图神经网络训练装置的框图。
[0026]图4本说明书根据一示例性实施例示出的一种图神经网络训练装置所在计算机设备的一种硬件结构图。
具体实施方式
[0027]这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。
[0028]需要说明的是：在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中，其方法所包括的步骤可以比本说明书所描述的更多或更少。此外，本说明书中所描述的单个步骤，在其他实施例中可能被分解为多个步骤进行描述；而本说明书中所描述的多个步骤，在其他实施例中也可能被合并为单个步骤进行描述。
[0029]大数据时代，为了防范金融欺诈，一般是基于机器学习，通过大量的有标签的交易数据训练出可以识别金融欺诈的网络，通过该网络找出可能存在风险的交易数据。而为了能更有效的找出存在风险的交易数据，需要对交易数据的金融欺诈(比如信用卡盗用、及交易欺诈和作弊违法违规等)的特征进行有效表征。相关技术中存在很多特征表征方法，将在下文对这些特征表征方法及其缺点进行一一说明。
[0030]首先是基于树模型的特征提取方法，该方法针对交易数据，基于树模型，利用每个属性下的取值分布，加入一系列复杂的人工设计规则，来区分每条交易数据是否存在金融欺诈风险。这种方法虽然有较强的可解释性，但是人工设计规则受限于人的经验，且设计较为复杂，通常为了确保该模型不会丢失一些特征，需要不断往该模型中加入新的规则，最终容易导致整个模型庞大，难以维护；此外，这种方法容易丢失高阶隐含特征。
[0031]其次，由于风控场景中，除了交易数据本身，交易关系、社群关系(两个用户之间是否为好友，是否加入了相同的群等)和设备关系(两个用户账号是否使用同一个设备等)等，都会对该交易数据的金融欺诈本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图神经网络训练方法，所述方法包括：获取初始图数据；所述初始图数据为包含若干个节点且具有拓扑结构的图的数据；计算所述初始图数据中每两个节点之间的亲密度；所述亲密度的大小与所述亲密度对应的两个节点的拓扑结构相似度正相关；针对每个节点i(i＝1,2,3,...N，N为图中的节点总数)，构建该节点的输入矩阵H
i
，其中，输入矩阵的第1列对应于节点i的特征向量，第2～M列分别对应于：与节点i的亲密度由大到小排序的其他M
‑
1个节点的特征向量；M为预设的小于等于N的自然数；以每个节点的输入矩阵作为输入，以每个节点的交易风险分类为输出，根据节点对应的交易风险分类标签，训练图神经网络；所述图神经网络用于对每个节点对应的用户的交易风险进行分类。2.根据权利要求1所述方法，所述方法还包括：针对每个节点，以该节点作为中心节点，构建子图；该子图包括M个节点，该子图中除中心节点外任一节点与中心节点的亲密度，大于任一未在该子图中的节点与中心节点的亲密度；M＜＜N，M为自然数。3.根据权利要求2所述方法，输入矩阵中的节点的特征向量包括：节点对应的业务特征，及节点在该子图中的拓扑结构特征。4.根据权利要求3所述方法，所述拓扑结构特征包括以下至少一种：该节点的绝对角色嵌入值；该节点与中心节点的亲密度；该节点距离子图中心节点的跳数；该节点的度数；该节点的核数；该节点的邻域影响力；该节点的一跳邻域连通性。5.根据权利要求1所述方法，所述以每个节点的输入矩阵作为输入，以每个节点的交易风险分类为输出，根据节点对应的交易风险分类标签，训练图神经网络，包括：迭代执行以下步骤，直至输出损失小于预设的损失阈值，或迭代次数大于预设的次数阈值：针对每个节点，基于自注意力机制，通过该节点的输入矩阵及注意力权重，更新该节点的特征向量；基于更新后的节点的特征向量与分类权重，确定每个更新后的节点的交易风险分类结果，并根据每个节点的交易风险分类标签，获得输出损失；根据输出损失更新注意力权重和节点分类权重；迭代结束后，基于当前的注意力权重和节点分类权重确定图神经网络。6.根据权利要求5所述方法，所述针对每个节点，基于自注意力机制，通过该节点的输入矩阵及注意力权重，更新该节点的特征向...

【专利技术属性】
技术研发人员：张屹綮，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人