一种模型训练方法、装置及电子设备制造方法及图纸

技术编号:35729562 阅读:16 留言:0更新日期:2022-11-26 18:29
本公开提供了一种模型训练方法、装置及电子设备,涉及计算机技术领域,尤其涉及深度学习领域。具体实现方案为:获取标签样本和无标签样本,并基于标签样本对无标签样本进行标记,得到标记后的无标签样本;对标签样本和标记后的无标签样本进行组合处理,得到初始标签样本;基于初始标签样本中多个样本数据之间的样本距离,及不同标签类型的样本数据之间的权重比值,计算得到半监督损失函数的损失值;更新权重比值,并基于更新后的权重比值更新初始标签样本,直至损失值小于预设数值时,基于更新后的初始标签样本得到目标标签样本;基于目标标签样本对预设模型进行训练,得到图嵌入模型,图嵌入模型用于确定表征待分析对象的风险程度图嵌入特征。程度图嵌入特征。程度图嵌入特征。

【技术实现步骤摘要】
一种模型训练方法、装置及电子设备


[0001]本公开涉及计算机
,尤其涉及深度学习领域,具体涉及一种模型训练方法、装置及电子设备。

技术介绍

[0002]图结构是一种用节点和边表示相互关系的数学模型。现实中,图结构可广泛应用于社交网络、单词共存网络和通信网络等场景中。通过对图结构进行分析,可以深入了解社会结构、语言和不同的交流模式,因此,图一直是学界研究的热点。
[0003]然而,在实际应用中,在训练图结构对应的图嵌入模型时,需要对训练样本进行标注,而通常训练样本包括无标签样本和标签样本,而无标签数据占比多,因此,需要对无标签数据进行标注。现有技术,通过人工标注的方式对无标签数据进行标注,该方式增加了标注人员的工作量,而且,人工标注还会存在标注错误的问题。
[0004]由此可见,采用现有的标注方式标注后的训练样本降低了模型训练的精度,进而降低了模型分析数据的准确度。

技术实现思路

[0005]本公开提供了一种用于模型训练方法、装置以及电子设备。
[0006]根据本公开的一方面,提供了一种模型训练方法,包括:获取标签样本和无标签样本,并基于标签样本对无标签样本进行标记,得到标记后的无标签样本;对标签样本和标记后的无标签样本进行组合处理,得到初始标签样本;基于初始标签样本中多个样本数据之间的样本距离,以及不同标签类型的样本数据之间的权重比值,计算得到半监督损失函数的损失值;更新权重比值,并基于更新后的权重比值更新初始标签样本,直至损失值小于预设数值时,基于更新后的初始标签样本得到目标标签样本;基于目标标签样本对预设模型进行训练,得到图嵌入模型,其中,图嵌入模型用于确定待分析对象的图嵌入特征,图嵌入特征表征待分析对象的风险程度。
[0007]由上述内容可知,本公开采用基于标签样本对无标签样本进行数据标注的方式,避免了现有技术中人工标注所存在的错标、漏标的问题,从而提高了训练样本的准确度,进而提高了模型训练的精度。另外,采用半监督损失函数,从而实现了图嵌入算法在半监督学习任务中的应用。而基于半监督损失函数来生成图嵌入模型不仅避免了直推式学习算法对算力要求高的问题,还提高了图嵌入模型的生成效率。最后,由于权重比值是基于样本数量确定的,因此,更新权重比值的过程其实质为更新不同标签类型的样本数据的过程,即在本公开中,通过更新不同标签类型的样本数据,均衡了正负样本能够均衡,进而提高了图嵌入模型的训练精度。
[0008]由此可见,本公开所提供的方案达到了生成图嵌入模型的目的,从而实现了提高图嵌入模型的训练精度的效果,进而避免了现有技术中所存在的图嵌入模型训练精度差的问题。
[0009]根据本公开的另一方面,提供了一种模型训练装置,包括:获取模块,用于获取标签样本和无标签样本,并基于标签样本对无标签样本进行标记,得到标记后的无标签样本;组合模块,用于对标签样本和标记后的无标签样本进行组合处理,得到初始标签样本;计算模块,用于基于初始标签样本中多个样本数据之间的样本距离,以及不同标签类型的样本数据之间的权重比值,计算得到半监督损失函数的损失值;更新模块,用于更新权重比值,并基于更新后的权重比值更新初始标签样本,直至损失值小于预设数值时,基于更新后的初始标签样本得到目标标签样本;训练模块,用于基于目标标签样本对预设模型进行训练,得到图嵌入模型,其中,图嵌入模型用于确定待分析对象的图嵌入特征,图嵌入特征表征待分析对象的风险程度。
[0010]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述的模型训练方法。
[0011]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行根据上述的模型训练方法。
[0012]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现根据上述的模型训练方法。
[0013]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0014]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0015]图1是根据本公开第一实施例的模型训练方法的流程图;
[0016]图2是根据本公开第二实施例的模型训练方法的流程图;
[0017]图3是根据本公开第三实施例的基于图嵌入模型对待分析对象进行分析的框图;
[0018]图4是根据本公开第四实施例的模型训练装置的示意图;
[0019]图5是用来实现本公开实施例的模型训练方法的电子设备的框图。
具体实施方式
[0020]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0021]需要说明的是,本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
[0022]实施例1
[0023]根据本公开的实施例,本公开提供了一种模型训练方法,其中,终端设备可作为本实施例所提供方法的执行主体,如图1所示,该方法包括如下步骤:
[0024]步骤S102,获取标签样本和无标签样本,并基于标签样本对无标签样本进行标记,得到标记后的无标签样本。
[0025]在步骤S102中,标签样本表示已进行标记的训练样本,无标签样本表示还未标记的训练样本,其中,标签样本又可以分为正样本和负样本,例如,在风控场景中,正样本表示出现在风控名单上的对象的相关信息,而负样本表示未出现在风控名单上的对象的相关信息。
[0026]可选的,终端设备可从数据源中读取标签样本和无标签样本,并计算标签样本中的每个样本数据与无标签样本中的每个样本数据之间的相似度,根据相似度来为无标签样本中的每个样本数据进行标记,从而实现了对无标签样本的标记。例如,在对无标签样本中的每个样本数据进行标记的过程中,终端设备从无标签样本读取待标记的样本数据,然后计算待标记的样本数据与标签样本中每个样本数据的相似度,并从标签样本中确定相似度最大的目标样本数据,然后确定该目标样本数据所对应的标签类型,根据该标签类型来对待标记的样本数据进行标记,即待标记的样本数据所对应的标签类型为目标样本数据所对应的标签类型。
[0027]需要说明的是,采用基于标签样本对无标签样本进行数据标注的方式,避免了现有技术中人工标注所存在的错标、漏标的问题,从而提高了训练样本的准确度,进而提高了模型训练的精度。
[0028]步骤S104,对标签样本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,包括:获取标签样本和无标签样本,并基于所述标签样本对所述无标签样本进行标记,得到标记后的无标签样本;对所述标签样本和标记后的无标签样本进行组合处理,得到初始标签样本;基于所述初始标签样本中多个样本数据之间的样本距离,以及不同标签类型的样本数据之间的权重比值,计算得到半监督损失函数的损失值;更新所述权重比值,并基于更新后的权重比值更新所述初始标签样本,直至所述损失值小于预设数值时,基于更新后的初始标签样本得到目标标签样本;基于所述目标标签样本对预设模型进行训练,得到图嵌入模型,其中,所述图嵌入模型用于确定待分析对象的图嵌入特征,所述图嵌入特征表征所述待分析对象的风险程度。2.根据权利要求1所述的方法,其中,基于所述标签样本对所述无标签样本进行标记,得到标记后的无标签样本,包括:计算所述无标签样本中的至少一个样本数据与所述标签样本中的至少一个样本数据的标签相似度;基于所述标签相似度对所述无标签样本中的样本数据进行标记,得到所述标记后的无标签样本。3.根据权利要求1所述的方法,所述方法还包括:计算所述初始标签样本中具有相同标签的样本数据之间的平均距离,得到第一平均距离;计算所述初始标签样本中具有不同标签的样本数据之间的平均距离,得到第二平均距离;基于所述第一平均距离和所述第二平均距离得到所述样本距离。4.根据权利要求3所述的方法,所述初始标签样本的标签类型至少包括正样本类型和负样本类型,所述方法还包括:获取所述初始标签样本中,所述标签类型为所述正样本类型的样本数据的数量,得到第一样本数量;获取所述初始标签样本中,所述标签类型为所述负样本类型的样本数据的数量,得到第二样本数量;计算所述第二样本数量与所述第一样本数量之间的比值,得到所述权重比值。5.根据权利要求3所述的方法,其中,基于所述初始标签样本中多个样本数据之间的样本距离,以及不同标签类型的样本数据之间的权重比值,计算得到半监督损失函数的损失值,包括:计算所述第一平均距离与所述第二平均距离的比值,得到目标平均距离;计算所述权重比值与所述目标平均距离之间的乘积,得到所述损失值。6.根据权利要求3所述的方法,其中,更新所述权重比值,并基于更新后的权重比值更新所述初始标签样本,包括:更新所述权重比值,得到所述更新后的权重比值;基于所述更新后的权重比值调整所述标记后的无标签样本中的样本数据所对应的标签,得到更新后的无标签样本;
基于所述更新后的无标签样本对所述初始标签样本进行更新,得到所述目标标签样本。7.根据权利要求1所述的方法,所述方法还包括:获取所述待分析对象的对象信息;基于所述图嵌入模型对所述对象信息进行分析,确定所述待分析对象所对应的图嵌入特征,其中,所述图嵌入模型由多个节点和多个边组成,所述多个边连接在所述多个节点之间,所述多个节点存储有多个对象的特征信息,所述多个边表征了所述多个对象之间的关联关系;基于所述图嵌入特征确定所述待分析对象的对象类型,其中,所述对象类型表征了所述待分析对象具有风险的程度。8.一种模型训练装置,包括:获取模块,用于获取标签样本和无标签样本,并基于所述标签样本对所述无标签样本进行标记,得到标记后的无标签样本;组合模块,用于对所述标签样本和标记后的无标签样本进行组合处理,得到初始标签样本;计算模块,用于基于所述初始标签样本中多个样本数据之间的样本距离,以及不同标签类型的样本数据之间的权重比值,计算得到...

【专利技术属性】
技术研发人员:许林丰
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1