【技术实现步骤摘要】
用于训练机器学习模型的方法和装置
[0001]本申请涉及机器学习技术,特别涉及用于训练机器学习模型的方法、装置、计算机系统和用于实施该方法的计算机可读存储介质。
技术介绍
[0002]近年来,以神经网络为代表的机器学习算法不断取得重大突破,其无论在性能还是效率上都显著优于传统算法。然而,数据驱动的机器学习模型会因为训练数据中存在的主观性成份而导致模型输出结果出现偏差或误判。
技术实现思路
[0003]本申请的一个目的是提供一种用于训练机器学习模型的装置和方法,其能够消除或减少主观性成份对机器学习模型输出结果的影响。
[0004]按照本申请的一个方面,提供一种用于训练机器学习模型的方法,包括:
[0005]生成训练样本集;
[0006]基于所述训练样本集构建关系网络,其中,所述训练样本集中的各个训练样本构成所述关系网络的节点,基于所述训练样本之间交互的存在性来定义所述节点之间的关系,并且将所述训练样本的基础属性用作相应节点的属性;以及
[0007]利用所述训练样本集来训练用于对所 ...
【技术保护点】
【技术特征摘要】
这里O1为第一目标函数,O2为第二目标函数,n为所述训练样本集中的训练样本的个数,loss(
·
,
·
)表示损失函数,f表示图神经网络,x
i
、y
i
分别为所述训练样本集中的第i个训练样本的基础属性和标签值,x
j
、y
j
分别为所述训练样本集中的第j个训练样本的基础属性和标签值,α为预先设定的系数。11.如权利要求1所述的方法,其中,所述目标函数O表示为:O
′
=O
′1+αO
′
22
这里O
‘1为第一目标函数,O
’2为第二目标函数,n为所述训练样本集中的训练样本的个数,loss(
·
,
·
)表示损失函数,f表示图神经网络,x
i
、y
i
分别为所述训练样本集中的第i个训练样本的基础属性和标签值,x
j
、y
j
分别为所述训练样本集中的第j个训练样本的基础属性和标签值,其中X\{x
j
}表示剔除x
j
后的训练样本集,K为小于n的正整数,α为预先设定的系数。12.如权利要求1
‑
11中任意一项所述的方法,其中,所述交互包括下列中的一种:交易行为、社交行为、消费行为和出行行为。13.一种计算机系统,包括:至少一个存储器;至少一个处理器;以及存储在所述存储器上并可在所述处理器上运行的计算机程序,该计算机程序在所述处理器上的运行导致下列操作:生成训练样本集;基于所述训练样本集构建关系网络,其中,所述训练样本集中的各个训练样本构成所述关系网络的节点,基于所述训练样本之间交互的存在性来定义所述节点之间的关系,并且将所述训练样本的基础属性用作相应节点的属性;以及利用所述训练样本集来训练用于对所述关系网络中的节点进行分类的图神经网络以得到分类器,其中,用于训练所述图神经网络的目标函数包含第一目标函数和第二目标函数,所述第一目标函数用于表示所述图神经网络输出的节点分类值与标签值之间的差异,所述第二目标函数用于表示节点之间在属性上的差...
【专利技术属性】
技术研发人员:水源,
申请(专利权)人:中国银联股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。