当前位置: 首页 > 专利查询>之江实验室专利>正文

一种预测模型的训练方法、装置、存储介质及电子设备制造方法及图纸

技术编号:38856586 阅读:12 留言:0更新日期:2023-09-17 10:01
本说明书公开了一种预测模型的训练方法、装置、存储介质及电子设备,通过对样本图中的各节点进行聚类,再基于聚类结果中与目标节点属于相同聚类簇但与目标节点不存在链接关系的各节点,以及与所述目标节点距离较近但与该目标节点之间也不存在链接关系的各节点,确定指定节点,并将该指定节点和目标节点进行组合得到负样本对,以及根据确定出的负样本对和基于样本图中原有的链接关系确定出的正样本对,对该预测模型进行训练。本方法能充分考虑并利用节点间的相似信息进行负采样,从而使得训练得到的预测模型,可针对每个节点,准确预测其他节点与该节点之间存在链接关系的可能性,提高了预测结果的准确率。高了预测结果的准确率。高了预测结果的准确率。

【技术实现步骤摘要】
一种预测模型的训练方法、装置、存储介质及电子设备


[0001]本说明书涉及图神经网络领域,尤其涉及一种预测模型的训练方法、装置、存储介质及电子设备。

技术介绍

[0002]目前,随着计算机技术的发展和业务融合的需要,图结构由于其可建模较多场景的数据的特点,被广泛应用于产品推荐、生物科学、金融等多种领域中。
[0003]但是,在现有技术中使用图结构来存储并展示信息的过程中,经常会遇到获取到的信息中缺失某种类型的信息,导致构建出的图结构无法准确地表达各实体之间的链接关系的情况出现。在该情况下,如何基于图结构中已有的链接关系,预测出图结构中尚未产生连边的两个节点之间产生链接的可能性,就变得愈发关键。
[0004]基于此,本说明书提供一种预测模型的训练方法。

技术实现思路

[0005]本说明书提供一种预测模型的训练方法、装置、存储介质及电子设备,以部分的解决现有技术存在的上述问题。
[0006]本说明书采用下述技术方案:本说明书提供一种预测模型的训练方法,包括:确定以实体为节点、以实体之间的关系为边的样本图;对所述样本图中的各节点进行聚类,确定所述样本图中的各聚类簇,并针对每个聚类簇,根据该聚类簇中各节点与其他聚类簇中各节点之间的距离,确定用于表征该聚类簇与其他聚类簇之间距离的中间距离;从各节点中确定目标节点,并将与所述目标节点属于相同聚类簇的节点作为所述目标节点的邻近区域内的节点,以及根据所述目标节点的位置、所述目标节点所属的聚类簇对应的中间距离以及所述各节点的位置,确定所述目标节点的中间区域包含的各节点;从所述邻近区域包含的各节点和所述中间区域包含的各节点中,确定与所述目标节点不具有链接关系的指定节点,并将所述指定节点和所述目标节点进行组合得到负样本对,以及根据所述样本图中原有的链接关系,确定正样本对;根据所述负样本对和所述正样本对,对所述预测模型进行训练。
[0007]可选地,确定以实体为节点、以实体之间的关系为边的样本图,具体包括:根据用户的历史行为数据,确定各实体以及所述各实体之间的链接关系,所述实体包括用户、产品、用户属性、产品属性中的至少一种;根据所述各实体以及所述各实体之间的链接关系,构建以各实体为节点、以各链接关系为边的样本图。
[0008]可选地,确定所述样本图中的各聚类簇,具体包括:确定预先设置的指定数量,所述指定数量为聚类结果中包含的聚类簇的数量;
根据所述指定数量,对所述样本图中的各节点进行聚类,确定出包含指定数量的聚类簇的聚类结果。
[0009]可选地,确定用于表征该聚类簇与其他聚类簇之间距离的中间距离,具体包括:从其他聚类簇中,确定指定聚类簇;针对该聚类簇中的每个节点,确定该节点与所述指定聚类簇中各节点之间的距离,作为第一距离;根据该聚类簇中各节点分别对应的第一距离,确定该聚类簇与所述指定聚类簇之间的指定距离;根据确定出的指定距离,确定用于表征该聚类簇与其他聚类簇之间距离的中间距离。
[0010]可选地,根据所述目标节点的位置、所述目标节点所属的聚类簇对应的中间距离以及所述各节点的位置,确定所述目标节点的中间区域包含的各节点,具体包括:以所述目标节点的位置为中心,以所述目标节点所述的聚类簇对应的中间距离为半径,确定待定中间区域;将所述待定中间区域中除与所述目标节点属于相同聚类簇的节点外的其他节点,作为所述目标节点的中间区域包含的节点。
[0011]可选地,从所述邻近区域包含的各节点和所述中间区域包含的各节点中,确定与所述目标节点不具有链接关系的指定节点,具体包括:从所述邻近区域包含的各节点中,确定与所述目标节点不具有链接关系的各节点,作为各第一指定节点;从所述中间区域包含的各节点中,确定与所述目标节点不具有链接关系的各节点,作为各第二指定节点;按照预设的采样比例,对所述各第一指定节点和所述各第二指定节点进行采样,将采样到的各节点分别与所述目标节点进行组合,得到各负样本对。
[0012]可选地,按照预设的采样比例,对所述各第一指定节点和所述各第二指定节点进行采样,将采样到的各节点分别与所述目标节点进行组合,得到各负样本对,具体包括:将所述中间区域外的区域作为遥远区域,并从所述遥远区域包含的各节点中,确定与所述目标节点不具有链接关系的各节点,作为各第三指定节点;按照预设的采样比例,对所述各第一指定节点、所述各第二指定节点和所述各第三指定节点分别进行采样,并将采样到的各节点分别和所述目标节点进行组合,得到负样本对。
[0013]本说明书提供一种预测模型的训练装置,所述装置包括:图确定模块,用于确定以实体为节点、以实体之间的关系为边的样本图;聚类模块,用于对所述样本图中的各节点进行聚类,确定所述样本图中的各聚类簇,并针对每个聚类簇,确定根据该聚类簇中各节点与其他聚类簇中各节点之间的距离,确定用于表征该聚类簇与其他聚类簇之间距离的中间距离;区域确定模块,用于从各节点中确定目标节点,并将与所述目标节点属于相同聚类簇的节点作为所述目标节点的邻近区域内的节点,以及根据所述目标节点的位置、所述目标节点所属的聚类簇对应的中间距离以及所述各节点的位置,确定所述目标节点的中间
区域包含的各节点;样本确定模块,用于从所述邻近区域包含的各节点和所述中间区域包含的各节点中,确定与所述目标节点不具有链接关系的指定节点,并将所述指定节点和所述目标节点进行组合得到负样本对,以及根据所述样本图中原有的链接关系,确定正样本对;训练模块,用于根据所述负样本对和所述正样本对,对所述预测模型进行训练。
[0014]本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述预测模型的训练方法。
[0015]本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述预测模型的训练方法。
[0016]本说明书采用的上述至少一个技术方案能够达到以下有益效果:通过对样本图中的各节点进行聚类,再基于聚类结果中与目标节点属于相同聚类簇但与目标节点不存在链接关系的各节点,以及与所述目标节点距离较近但与该目标节点之间也不存在链接关系的各节点,确定指定节点,并将该指定节点和目标节点进行组合得到负样本对,以及根据确定出的负样本对和基于样本图中原有的链接关系确定出的正样本对,对该预测模型进行训练。
[0017]本方法能充分考虑并利用节点间的相似信息进行负采样,从而使得训练得到的预测模型,可针对每个节点,准确预测与该节点距离较近的其他节点以及与该节点具有一定相似性的节点是否与该节点之间具有链接关系,即,其他节点与该节点之间存在链接关系的可能性,提高了预测结果的准确率。
附图说明
[0018]此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:图1为本说明书提供的预测模型的训练方法的流程示意图;图2为本说明书提供的样本确定方法本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种预测模型的训练方法,其特征在于,所述方法包括:确定以实体为节点、以实体之间的关系为边的样本图;对所述样本图中的各节点进行聚类,确定所述样本图中的各聚类簇,并针对每个聚类簇,根据该聚类簇中各节点与其他聚类簇中各节点之间的距离,确定用于表征该聚类簇与其他聚类簇之间距离的中间距离;从各节点中确定目标节点,并将与所述目标节点属于相同聚类簇的节点作为所述目标节点的邻近区域内的节点,以及根据所述目标节点的位置、所述目标节点所属的聚类簇对应的中间距离以及所述各节点的位置,确定所述目标节点的中间区域包含的各节点;从所述邻近区域包含的各节点和所述中间区域包含的各节点中,确定与所述目标节点不具有链接关系的指定节点,并将所述指定节点和所述目标节点进行组合得到负样本对,以及根据所述样本图中原有的链接关系,确定正样本对;根据所述负样本对和所述正样本对,对所述预测模型进行训练。2.如权利要求1所述的方法,其特征在于,确定以实体为节点、以实体之间的关系为边的样本图,具体包括:根据用户的历史行为数据,确定各实体以及所述各实体之间的链接关系,所述实体包括用户、产品、用户属性、产品属性中的至少一种;根据所述各实体以及所述各实体之间的链接关系,构建以各实体为节点、以各链接关系为边的样本图。3.如权利要求1所述的方法,其特征在于,确定所述样本图中的各聚类簇,具体包括:确定预先设置的指定数量,所述指定数量为聚类结果中包含的聚类簇的数量;根据所述指定数量,对所述样本图中的各节点进行聚类,确定出包含指定数量的聚类簇的聚类结果。4.如权利要求1所述的方法,其特征在于,确定用于表征该聚类簇与其他聚类簇之间距离的中间距离,具体包括:从其他聚类簇中,确定指定聚类簇;针对该聚类簇中的每个节点,确定该节点与所述指定聚类簇中各节点之间的距离,作为第一距离;根据该聚类簇中各节点分别对应的第一距离,确定该聚类簇与所述指定聚类簇之间的指定距离;根据确定出的指定距离,确定用于表征该聚类簇与其他聚类簇之间距离的中间距离。5.如权利要求1所述的方法,其特征在于,根据所述目标节点的位置、所述目标节点所属的聚类簇对应的中间距离以及所述各节点的位置,确定所述目标节点的中间区域包含的各节点,具体包括:以所述目标节点的位置为中心,以所述目标节点所述的聚类簇对应的中间距离为半径,确定待定中间区域;将所述待定中间区域中除与所述目标节点属于相同聚类簇的节点外的其他节点,作为所述目标节点的中间区域包含的节点。6.如权利要求1所述...

【专利技术属性】
技术研发人员:余磊吕劲松陈红阳
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1