【技术实现步骤摘要】
一种基于边采样的异质信息网络嵌入方法
本专利技术涉及数据安全
,具体涉及一种基于边采样的异质信息网络嵌入方法。
技术介绍
现有技术中关于情报数据层次分级的方法很少,仅有根据用户属性或特定行为进行划分的方法,该类方法依赖于用户属性和行为,扩展性不强。现有技术中存在情报分析的方法,基于内容相似度的推送方法中使用关键词及专家打分建立用户兴趣模型,并计算相似度后进行推荐,其本质还是基础矩阵分解的内容,缺点是无法解决矩阵稀疏性的问题;基于检索系统的方法中使用不同的国际和国内联机联合检索系统,对于关键词进行筛选、对比、分类等操作,缺点是无法针对每个用户做出个性化的推荐;基于情报定制服务的方法中,根据用户属性和特点进行主动的情报推送,缺点是没有挖掘并利用用户的隐式需求。现有技术中的图嵌入算法包括基于相似度保留、消息传递和关系学习的图嵌入算法。基于相似度保留的图嵌入算法有metapathvec,由元路径约束,在关系网络中进行随机游走,并使用skip-gram算法进行训练。缺点是游走结果必须匹配元路径,捕捉到的节点结构信 ...
【技术保护点】
1.一种基于边采样的异质信息网络嵌入方法,其特征在于,包括以下步骤:/nS1、对情报数据集中每一条边的权重进行预处理,得到游走权重;/nS2、从情报元素节点集中选取第i个情报元素节点作为游走起点,基于游走权重,对游走起点基于边采样进行额定长度的多次游走,得到游走数组;/nS3、判断i是否等于|V|,若是,将得到的多个游走数组构建为游走数组集,并跳转至步骤S4,若否,则将i自加1,返回步骤S2,其中,|V|为情报元素节点集V中情报元素节点的总数,1≤i≤|V|;/nS4、选取游走数组集中的一个游走数组,并基于该游走数组构建训练样本,将训练样本输入单隐层神经网络,并采用随机梯度 ...
【技术特征摘要】
1.一种基于边采样的异质信息网络嵌入方法,其特征在于,包括以下步骤:
S1、对情报数据集中每一条边的权重进行预处理,得到游走权重;
S2、从情报元素节点集中选取第i个情报元素节点作为游走起点,基于游走权重,对游走起点基于边采样进行额定长度的多次游走,得到游走数组;
S3、判断i是否等于|V|,若是,将得到的多个游走数组构建为游走数组集,并跳转至步骤S4,若否,则将i自加1,返回步骤S2,其中,|V|为情报元素节点集V中情报元素节点的总数,1≤i≤|V|;
S4、选取游走数组集中的一个游走数组,并基于该游走数组构建训练样本,将训练样本输入单隐层神经网络,并采用随机梯度下降法进行训练,得到训练完成的单隐层神经网络;
S5、将情报元素节点集中的情报元素节点输入训练完成的单隐层神经网络,得到嵌入向量。
2.根据权利要求1所述的基于边采样的异质信息网络嵌入方法,其特征在于,所述步骤S1中游走权重的计算公式为:
其中,w′为游走权重,ap,q(npre,nnext)为游走偏移,为当前情报元素节点ncur和下一跳情报元素节点nnext间所连边的权重,npre为当前情报元素节点ncur的上一跳情报元素节点,p为控制游走偏向DFS的参数,q为控制游走偏向BFS的参数,为从上一跳情报元素节点npre到下一跳情报元素节点nnext的跳数。
3.根据权利要求1所述的基于边采样的异质信息网络嵌入方法,其特征在于,所述步骤S2中对游走起点基于边采样进行额定长度的多次游走,得到游走数组包括以下分步骤:
A1、对游走起点ni的每条邻边构建矩形,将面积大于1的游走起点ni的第j条邻边的矩形大于1的部分分配至面积小于1的矩形中,得到面积为1的多个矩形;
A2、将多个矩形构建为矩形框,并基于矩形框构建第一数组accept和第二数组alias,其中,第一数组accept中元素accept[j]为游走起点ni的第j条邻边对应的邻情报元素节点与矩形框第j列矩形的面积比例,第二数组alias中元素alias[j]为矩形框的第j列矩形中另一个邻情报元素节点的编号;
A3、生成两组随机数randomri∈[0,N-1]和ari~U(0,1),其中,N为游走起点ni的邻情报元素节点总数,U(0,1)为服从0到1的均匀分布,ri为游走起点ni当前游走的第ri次;
A4、判断随机数ari是否小于面积比例accept[j],若是,则将邻情报元素节占加入游走数组walki,若否,则将邻情报元素节点加入游走数组walki;
A5、判断游走数组walki中的元素数量是否小于额...
【专利技术属性】
技术研发人员:王梦惟,利强,潘晔,王沙飞,邵怀宗,林静然,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。