一种多维特征图嵌入方法、装置、设备及介质制造方法及图纸

技术编号:23558844 阅读:79 留言:0更新日期:2020-03-25 04:16
本申请提供的多维特征图嵌入方法,包括:根据服务器各节点之间的第一特征的相似度构建第一矩阵,第一矩阵记录了各个节点间关于第一特征的相似度;根据服务器各节点之间的第二特征的相似度构建第二矩阵,第二矩阵记录了各个节点间关于第二特征的相似度,第二特征为与第一特征不同的特征;根据第一矩阵与第二矩阵进行模型训练,得到第一模型;根据第一模型获取服务器中各个节点的节点向量。本申请实施例还提供一种装置、设备及介质,在生成向量的过程中,通过引入额外特征的约束,使得最终生成的向量不仅能够反映出图的拓扑信息,而且还能够融入节点自身的属性特征。

A method, device, device and medium for embedding multi-dimensional feature map

【技术实现步骤摘要】
一种多维特征图嵌入方法、装置、设备及介质
本专利技术涉及计算机
,更具体地说,涉及一种多维特征图嵌入方法、装置、设备及介质。
技术介绍
机器学习(MachineLearning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。其中,图嵌入(graphembedding,networkembedding)是一种将图数据(通常为高维稠密的矩阵)映射为低微稠密向量的过程,能够很好地解决图数据难以高效输入机器学习算法的问题。在现有的图嵌入技术中,都只考虑了图拓扑节点的向量表征,忽略了节点自身的特征,普遍的做法是直接将人工提取的节点特征和节点生成向量Node2vec生成的向量简单的拼接在一起,这种做法不利于后续的模型学习,另一种做法是通过将节点的信息通过人工经验融入到边的权重中,这种做法主观意识干预比较大,可能不能反映真实的图拓扑结构。因此,现有技术中存在的问题还有待于改进。
技术实现思路
有鉴于此,为解决上述问题,本专利技术提供的技术方案如下:一种多维特征图嵌入方法,包括:根据服务器各节点之间的第一特征的相似度构建第一矩阵,所述第一矩阵记录了所述各个节点间关于所述第一特征的相似度;根据所述服务器各节点之间的第二特征的相似度构建第二矩阵,所述第二矩阵记录了所述各个节点间关于所述第二特征的相似度,所述第二特征为与所述第一特征不同的特征;根据所述第一矩阵与所述第二矩阵进行模型训练,得到第一模型;根据所述第一模型获取所述服务器中各个节点的节点向量。一种多维特征图嵌入装置,包括:第一构建单元,所述第一构建单元用于根据服务器各节点之间的第一特征的相似度构建第一矩阵,所述第一矩阵记录了所述各个节点间关于所述第一特征的相似度;第二构建单元,所述第二构建单元用于根据所述服务器各节点之间的第二特征的相似度构建第二矩阵,所述第二矩阵记录了所述各个节点间关于所述第二特征的相似度,所述第二特征为与所述第一特征不同的特征;训练单元,所述训练单元用于根据所述第一构建单元构建的所述第一矩阵与所述第二构建单元构建的所述第二矩阵进行模型训练,得到第一模型;获取单元,所述获取单元用于根据所述训练单元训练的所述第一模型获取所述服务器中各个节点的节点向量。可选地,所述第一构建单元还用于:当第一节点i与第二节点j之间的第一子特征相同时,获取第一分值;当所述第一节点i与所述第二节点j之间的第二子特征相同时,获取第二分值;其中,所述第一节点i与所述第二节点j为所述服务器中的任意两个节点,所述第一子特征与所述第二子特征为所述第一特征下的子特征;获取所述第一分值与所述第二分值的加和作为第一元素值,所述第一矩阵中的元素ai,j等于所述第一元素值,所述ai,j在所述第一矩阵的横行对应所述第一节点i,所述的ai,j在所述第一矩阵的纵列对应所述第二节点j。可选地,所述第一构建单元还用于:将所述第一元素值进行归一化得到第二元素值,所述ai,j等于所述第二元素值。可选地,所述第二构建单元还用于:根据第一节点i与第二节点j之间收发的第一数据值构建所述第二矩阵,其中,所述第二矩阵的元素bi,j等于所述第一数据值,所述bi,j在所述第二矩阵的横行对应所述第一节点i,所述的bi,j在所述第二矩阵的纵列对应所述第二节点j。可选地,所述训练单元,还用于:获取所述第二矩阵中所述第一节点i的节点向量ui及所述第二节点的节点向量uj;在所述第一模型中执行以下目标函数:其中,所述为词生成向量Word2vec为最大似然估计部分,所述f(u)为任意一个节点向量的函数映射,所述Ns(u)为与所述f(u)相邻节点的函数映射,通过计算Pr()任意一个节点与相邻节点间相似度的条件概率,之后通过取对数求得一个节点与相邻节点的最大似然估计,所述节点u属于节点集合V中的任意一个节点,求和后得到所有节点的最大似然估计;为自定义函数部分,所述ai,j为所述第一矩阵中的元素;所述根据所述第一模型获取所述服务器中各个节点的节点向量,包括:基于负采样的Skip-gram模型和所述目标函数获取所述服务器中各个节点的节点向量。可选地,所述训练单元还用于:根据随机游走生成的上下文节点序列计算所述最大似然估计部分:根据所述第一矩阵及所述第二矩阵计算所述自定义函数部分:ui:=ui+[aij-ui·uj]·uj其中,所述ui+[aij-ui·uj]·uj为所述求导之后的结果,即,节点向量ui在更新之后等于原有第一节点向量ui加上原有第二节点向量uj乘以所述元素ai,j减去原有第一节点向量ui乘以原有第二节点向量uj的差;uj乘以所述元素ai,j减去原有第一节点向量ui乘以原有第二节点向量uj的差;将所述最大似然估计部分与所述自定义函数部分相加得到最终的更新向量:v(w):=v(w)+ui。可选地,所述装置还包括聚类单元,所述聚类单元用于:通过聚类算法对所述节点向量进行聚类,得到多个簇;根据所述每个簇的恶意度来判断每个簇中的节点向量所对应节点的恶意度。可选地,所述装置还包括分类单元,所述分类单元用于:通过已知的黑白标签和所述节点向量作为输入,输出为二分类概率值;对于所述二分类概率值大于阈值的节点,判定为具有恶意的黑节点;对于所述二分类概率值小于阈值的节点,判定为无恶意的白节点。一种计算机存储介质,包括指令,当该指令在计算机设备上运行时,使得该计算机设备执行上述任意一项所述的方法。一种计算机可读存储介质,包括指令,当所述指令在计算机设备上运行时,使得所述计算机设备执行上述任意一项所述的方法。本申请提供的多维特征图嵌入方法,包括:根据服务器各节点之间的第一特征的相似度构建第一矩阵,第一矩阵记录了各个节点间关于第一特征的相似度;根据服务器各节点之间的第二特征的相似度构建第二矩阵,第二矩阵记录了各个节点间关于第二特征的相似度,第二特征为与第一特征不同的特征;根据第一矩阵与第二矩阵进行模型训练,得到第一模型;根据第一模型获取服务器中各个节点的节点向量。本申请实施例还提供一种装置、设备及介质,在生成向量的过程中,通过引入额外特征的约束,使得最终生成的向量不仅能够反映出图的拓扑信息,而且还能够融入节点自身的属性特征。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显本文档来自技高网...

【技术保护点】
1.一种多维特征图嵌入方法,其特征在于,包括:/n根据服务器各节点之间的第一特征的相似度构建第一矩阵,所述第一矩阵记录了所述各个节点间关于所述第一特征的相似度;/n根据所述服务器各节点之间的第二特征的相似度构建第二矩阵,所述第二矩阵记录了所述各个节点间关于所述第二特征的相似度,所述第二特征为与所述第一特征不同的特征;/n根据所述第一矩阵与所述第二矩阵进行模型训练,得到第一模型;/n根据所述第一模型获取所述服务器中各个节点的节点向量。/n

【技术特征摘要】
1.一种多维特征图嵌入方法,其特征在于,包括:
根据服务器各节点之间的第一特征的相似度构建第一矩阵,所述第一矩阵记录了所述各个节点间关于所述第一特征的相似度;
根据所述服务器各节点之间的第二特征的相似度构建第二矩阵,所述第二矩阵记录了所述各个节点间关于所述第二特征的相似度,所述第二特征为与所述第一特征不同的特征;
根据所述第一矩阵与所述第二矩阵进行模型训练,得到第一模型;
根据所述第一模型获取所述服务器中各个节点的节点向量。


2.根据权利要求1所述的方法,其特征在于,所述根据服务器各节点之间的第一特征的相似度构建第一矩阵,包括:
当第一节点i与第二节点j之间的第一子特征相同时,获取第一分值;
当所述第一节点i与所述第二节点j之间的第二子特征相同时,获取第二分值;
其中,所述第一节点i与所述第二节点j为所述服务器中的任意两个节点,所述第一子特征与所述第二子特征为所述第一特征的子特征;
获取所述第一分值与所述第二分值的加和作为第一元素值,所述第一矩阵中的元素ai,j等于所述第一元素值,所述ai,j在所述第一矩阵的横行对应所述第一节点i,所述的ai,j在所述第一矩阵的纵列对应所述第二节点j。


3.根据权利要求2所述的方法,其特征在于,所述获取所述第一分值与所述第二分值的加和作为第一元素值之后,还包括:
将所述第一元素值进行归一化得到第二元素值,所述ai,j等于所述第二元素值。


4.根据权利要求3所述的方法,其特征在于,所述根据所述服务器各节点之间的第二特征的相似度构建第二矩阵,包括:
根据第一节点i与第二节点j之间收发的第一数据值构建所述第二矩阵,其中,所述第二矩阵的元素bi,j等于所述第一数据值,所述bi,j在所述第二矩阵的横行对应所述第一节点i,所述的bi,j在所述第二矩阵的纵列对应所述第二节点j。


5.根据权利要求4所述的方法,其特征在于,根据所述第一矩阵与所述第二矩阵进行模型训练,得到第一模型,包括:
获取所述第二矩阵中所述第一节点i的节点向量ui及所述第二节点j的节点向量uj;
在所述第一模型中执行以下目标函数:



其中,为词生成向量Word2vec为最大似然估计部分,所述f(u)为任意一个节点向量的函数映射,所述Ns(u)为与所述f(u)相邻节点的函数映射,通过计算Pr()任意一个节点与相邻节点间相似度的条件概率,之后通过取对数求得一个节点与相邻节点的最大似然估计,所述节点u属于节点集合V中的任意一个节点,求和后得到所有节点的最大似然估计;

为自定义函数部分,所述ai,j为所述第一矩阵中的元素;
所述根据所述第一模型获取所述服务器中各...

【专利技术属性】
技术研发人员:刘浩陈旺林齐雅婷冯淦
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1