【技术实现步骤摘要】
一种基于深度哈希的符号社交网络嵌入方法
本专利技术涉及一种符号社交网络嵌入方法,具体涉及基于深度哈希的符号社交网络嵌入方法,属于计算机自然语言处理技术中的社交媒体领域。
技术介绍
网络是表达物体和物体间联系的一种重要形式,针对网络的分析研究的一个关键问题就是研究如何合理地表示网络中的特征信息。网络表示是衔接网络原始数据和网络应用任务的桥梁。网络表示学习,负责从网络数据中学习得到网络中每个节点的向量表示,之后这些节点表示就可以作为节点的特征应用于后续的网络应用任务。随着微信、微博、Facebook为代表的社会媒体不断发展,网络表示学习引起了学术界和工业界的广泛关注。传统的网络表示学习采用图矩阵表示,由于其稀疏性,难以应用到真实的网络中。近年来,基于机器学习的网络嵌入方法因算法效率高、极大降低网络维度的同时较好的保存了网络的结构信息,逐渐成为网络表示学习的主流方法。为进一步降低低维空间内最近邻搜索的时间复杂度,一些基于哈希的网络嵌入方法被陆续提出,并取得了较好的成效。但是,现有的基于哈希的网络嵌入方法,在处理标记社交网络时,其仅考虑其正边信息,而忽略了负边信息。标记社 ...
【技术保护点】
1.一种基于深度哈希的符号社交网络嵌入方法,其特征在于,包括以下步骤:从公共数据集中,分别选取一种稀疏网络和稠密网络,作为实验数据集,分别进行数据收集阶段、训练阶段和测试阶段的处理;具体如下:步骤一、数据收集阶段:步骤1:从实验数据集中,抽取每条边及边权,构成边集ε;其中,边集ε={(vi,vj,eij)},vi、vj表示网络中的节点,vi、
【技术特征摘要】
1.一种基于深度哈希的符号社交网络嵌入方法,其特征在于,包括以下步骤:从公共数据集中,分别选取一种稀疏网络和稠密网络,作为实验数据集,分别进行数据收集阶段、训练阶段和测试阶段的处理;具体如下:步骤一、数据收集阶段:步骤1:从实验数据集中,抽取每条边及边权,构成边集ε;其中,边集ε={(vi,vj,eij)},vi、vj表示网络中的节点,vi、边权eij∈{1,-1}表示正边和负边,正边条数为NP,负边条数为NN;步骤2:根据边集ε,获得三元组集合eij=1,ejk=-1;方法如下:步骤2.1:根据边集ε中正边和负边信息,分别构建正边图和负边图;其中,正边图表示原网络去除所有负边后的结构,相反可得到负边图;步骤2.2:从正边图和负边图中,提取三元组(vi,vj,vk);步骤二、进行训练:步骤3:初始化HSNE模型中的所有参数θ;其中,HSNE为深度哈希模型,由三部分相同且共享参数的深度哈希模型HSNEi组成;HSNEi包括网络特征学习、哈希码学习和损失函数;网络特征学习:由Embedding层和三个全连接层组成,Embedding层维度为d0,三个全连接层维度为di;哈希码学习:由一个全连接层和量化层组成,全连接层的维度为d;模型的全连接层均以双曲正切函数tanh为激活函数;步骤4:为控制模型规模,选取mini-batch大小为B;对数据集按大小划分mini-batch,对每个mini-batch,做如下训练:步骤4.1:将输入HSNE模型,获得输出步骤4.2:对输出进行量化,得到按照损失函数计算损失:其中,表示模型的输出;θ表示模型参数;x0表示上述v0经模型的输出;和为步骤一所述的数据集;,表示任意节点vi和vj对应的哈希码之间汉明距离;M表示网络中节点总个数,则xm表示网络中vm节点经模型的输出;表示步骤4.2量化结果,bm=sgn(xm);表示矩阵2-范式的平方;δ,δ0,α,η表示模型的超参数;步骤4.3:基于梯度下降算法,反向更新模型参数θ;步骤5:当模型损失随...
【专利技术属性】
技术研发人员:毛先领,郭佳楠,姜晓健,孙英翔,黄河燕,牟其林,邹佳,
申请(专利权)人:北京理工大学,中电科大数据研究院有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。