System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于用户图数据建立业务分析模型的方法及设备技术_技高网

基于用户图数据建立业务分析模型的方法及设备技术

技术编号:40935816 阅读:5 留言:0更新日期:2024-04-18 14:55
本发明专利技术提供了一种基于用户图数据建立业务分析模型的方法及设备,涉及机器学习领域。该方法包括:通过获取多个用户的图数据作为训练样本;从训练样本中提取预设数量的图数据构成正样本集合,并基于正样本集合获取负样本集合;基于正样本集合和负样本集合生成预设数量的样本对,并将样本对分别输入多个待训练模型中进行互学习训练获得图神经网络模型;对图神经网络模型的模型精度进行验证,根据验证结果对图神经网络进行迭代训练,得到业务分析模型。通过用户的图数据进行自监督对比学习,提高模型的泛化能力;并通过模型间互学习的方式以更有效地学到丰富关键的图表示信息,从而通过用户图数据分析出更符合用户实际情况的个性化业务推荐。

【技术实现步骤摘要】

本申请涉及机器学习领域,尤其涉及一种基于用户图数据建立业务分析模型的方法及设备


技术介绍

1、图是一种数据结构,图神经网络是深度学习在图结构上的一个分支。常见的图结构包含节点和边,其中,节点包含了实体信息,边包含实体间的关系信息。现在许多学习任务都需要处理图结构的数据,比如物理系统建模、社交网络分析、交通网络分析、蛋白质结构预测以及分子性质预测等,都需要模型能够从图结构的输入中学习相关的知识。

2、现有技术中经常需要对用户关系数据进行处理,然后通过识别社交网络中的用户关系及用户业务订购及业务消费情况,对用户的业务提供个性化推荐。而大多数图神经网络使用有监督学习的方式进行训练。但是有监督学习存在想要获得大量高质量的标签往往费时费力、十分困难,且有监督表达学习倾向于使得模型学习到与标签相关的信息,难以满足模型学习知识的需求。在实际情况中对图数据建模的图神经网络的学习和训练时,很难获得大量标签数据,导致建模难度大或建模精度低,难以满足对用户关系的图数据分析要求。


技术实现思路

1、本申请提供一种基于用户图数据建立业务分析模型的方法及设备,用以解决现有的图神经网络训练难度大且精度低、可靠性差,难以为用户提供精准业务推荐的技术问题。

2、第一方面,本申请提供一种基于用户图数据建立业务分析模型的方法,包括:

3、获取多个用户的图数据作为训练样本,每个图数据包含多个节点、每个节点的属性特征和各节点之间的连接关系;

4、从所述训练样本中提取预设数量的图数据构成正样本集合,并基于所述正样本集合获取负样本集合;所述负样本集合中包含预设数量的虚假样本,所述虚假样本是通过对正样本集合中图数据的各节点的属性特征和连接关系进行特征扰动处理后得到的;

5、基于所述正样本集合和所述负样本集合生成预设数量的样本对,并将所述样本对分别输入多个待训练模型中进行互学习训练获得图神经网络模型,所述互学习训练为模型训练过程中通过调整模型参数缩小各模型之间的输出差异;

6、对所述图神经网络模型的模型精度进行验证,根据验证结果对所述图神经网络进行迭代训练,得到业务分析模型;所述业务分析模型用于根据用户的图数据对用户进行分析,生成业务推荐。

7、在一种可能的设计中,所述对所述图神经网络模型的模型精度进行验证,根据验证结果对所述图神经网络进行迭代训练,得到业务分析模型,包括:

8、判断所述模型精度是否大于预设精度阈值;

9、若所述图神经网络模型的模型精度小于或等于所述预设精度阈值,将所述图神经网络模型作为下一轮训练的待训练模型并从所述训练样本剩余的图数据中提取预设数量的图数据构成正样本集合,返回基于所述正样本集合获取负样本集合的步骤,直至所述图神经网络模型的模型精度达到预设精度要求得到业务分析模型。

10、在一种可能的设计中,所述基于所述正样本集合获取负样本集合,包括:

11、随机筛选出预设数量的目标节点,并对所述目标节点对应的属性特征和与所述目标节点相关的连接关系进行扰动处理获得初级样本;

12、对所述初级样本中每个节点对应的属性特征和各节点之间的连接关系分别进行特征融合,得到虚假样本;

13、将所述正样本集合中每个图数据对应的虚假样本进行汇总得到负样本集合。

14、在一种可能的设计中,所述将所述样本对分别输入多个待训练模型中进行互学习训练获得图神经网络模型,包括:

15、分别将所述样本对输入多个待训练模型中进行对比学习得到多个初级分析模型;

16、从所述训练样本中随机提取一个用户的图数据作为验证图数据,并将所述验证图数据分别输入所述初级分析模型得到每个初级分析模型对应的预测分布结果,所述预测分布结果为概率分布最高的业务构成的业务推荐组合;

17、基于所述预测分布结果分析所述初级分析模型之间的预测差异,并通过调整各初级分析模型的参数将所述预测差异进行最小化处理,得到多个相同的图神经网络模型。

18、在一种可能的设计中,所述待训练模型包括:输入层、隐层以及输出层;所述分别将所述样本对输入多个待训练模型中进行对比学习得到多个初级分析模型,包括:

19、获取隐层的隐式表示空间;

20、通过所述隐式表示空间对所述样本对进行真实样本和虚假样本的判别,获得特征相似度关联;

21、根据所述特征相似度关联进行有监督学习构建初级分析模型。

22、在一种可能的设计中,将所述初级分析模型之间的预测分布差异进行分析之前,还包括:

23、将所述正样本集合中的图数据输入所述初级分析模型进行编码得到第一业务向量;

24、通过对所述第一业务向量进行解码得到图重建数据;

25、将所述图重建数据与原始的图数据样本进行对比获得均方损失;

26、基于所述均方损失对所述初级分析模型进行优化。

27、在一种可能的设计中,还包括:

28、获取所述正样本集合中的图数据对应的真值业务向量;

29、将所述图数据输入所述初级分析模型进行编码得到第二业务向量;

30、通过对所述第二业务向量进行映射得到预测业务向量;

31、将所述预测业务向量与所述真值业务向量进行对比获得交叉熵损失;

32、基于所述交叉熵损失对所述初级分析模型进行优化。

33、第二方面,本申请提供一种基于用户图数据的业务分析方法,包括:

34、获取目标用户的图数据;

35、将所述图数据输入如第一方面中任一项所述业务分析模型得到业务推荐信息,所述业务推荐信息包括由多个业务构成的业务推荐组合和每个业务对应的属性信息。

36、第三方面,本申请提供一种基于用户图数据建立业务分析模型的设备,包括:

37、获取模块,用于获取多个用户的图数据作为训练样本,每个图数据包含多个节点、每个节点的属性特征和各节点之间的连接关系;

38、构建模块,用于从所述训练样本中提取预设数量的图数据构成正样本集合,并基于所述正样本集合获取负样本集合;

39、训练模块,用于分别将所述正样本集合和所述负样本集合中的样本数据输入多个待训练模型中进行互学习训练获得图神经网络模型,所述互学习训练为模型训练过程中通过调整模型参数缩小各模型之间的输出差异;

40、迭代模块,用于对所述图神经网络模型的模型精度进行验证,根据验证结果对所述图神经网络进行迭代训练,得到业务分析模型;所述业务分析模型用于根据用户的图数据对用户进行分析,生成业务推荐。

41、在一种可能的设计中,迭代模块,具体用于:

42、判断所述模型精度是否大于预设精度阈值;

43、若所述图神经网络模型的模型精度小于或等于所述预设精度阈值,将所述图神经网络模型作为下一轮训练的待训练模型并从所述训练样本剩余的图数据中提取预设数量的图数本文档来自技高网...

【技术保护点】

1.一种基于用户图数据建立业务分析模型的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述图神经网络模型的模型精度进行验证,根据验证结果对所述图神经网络进行迭代训练,得到业务分析模型,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述正样本集合获取负样本集合,包括:

4.根据权利要求1所述的方法,其特征在于,所述将所述样本对分别输入多个待训练模型中进行互学习训练获得图神经网络模型,包括:

5.根据权利要求4所述的方法,其特征在于,所述待训练模型包括:输入层、隐层以及输出层;所述分别将所述样本对输入多个待训练模型中进行对比学习得到多个初级分析模型,包括:

6.根据权利要求4所述的方法,其特征在于,将所述初级分析模型之间的预测分布差异进行分析之前,还包括:

7.根据权利要求6所述的方法,其特征在于,还包括:

8.一种基于用户图数据的业务分析方法,其特征在于,包括:

9.一种基于用户图数据建立业务分析模型的设备,其特征在于,包括:

10.一种基于用户图数据建立业务分析模型的设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;

11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至7任一项所述的方法。

...

【技术特征摘要】

1.一种基于用户图数据建立业务分析模型的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述图神经网络模型的模型精度进行验证,根据验证结果对所述图神经网络进行迭代训练,得到业务分析模型,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述正样本集合获取负样本集合,包括:

4.根据权利要求1所述的方法,其特征在于,所述将所述样本对分别输入多个待训练模型中进行互学习训练获得图神经网络模型,包括:

5.根据权利要求4所述的方法,其特征在于,所述待训练模型包括:输入层、隐层以及输出层;所述分别将所述样本对输入多个待训练模型中进行对比学习得到多个初级分析模...

【专利技术属性】
技术研发人员:汪悦高伟程新洲宋春涛张帆李鹏飞赵慧英谢志普
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1