【技术实现步骤摘要】
一种基于宽度学习系统的快速网络表征学习算法
本专利技术属于自然语言处理领域,提出了一种采用宽度学习系统进行网络表征学习及对网络中的节点进行多标签分类的方法,涉及网络中节点的特征表示,构建宽度学习系统网络的分类模型,以及生成训练数据等。
技术介绍
基于随机游走的网络表征算法,例如DeepWalk,利用了word2vec的方法,将网络中的节点类比成自然语言处理中的单词,将网络中每一条连接路径比作自然语言处理中的句子;利用SkipGram算法来计算网络节点之间的连接结构及生成节点的向量表示。既反映了相应网络节点与其周围相邻节点联系的结构特征,又实现了节点的低维向量表示。这就为网络表征问题,提供了利用机器学习算法处理的思路。宽度学习系统采用类似于随机向量函数链接神经网络(RandomVectorFunctionLinkNeuralNetwork,RVFLNN)的结构,很好地解决了传统神经网络耗时较长的问题。现在,宽度学习系统(BroadLearningSystem,BLS)逐渐成为一种典型的优化传统神经网络以及深度神经网络的机器学习算法。宽度学习系统由特征向量层、增强向量 ...
【技术保护点】
1.一种基于宽度学习系统的快速网络表征学习算法,其特征在于具有如下步骤:S1、导入基于文本的网络图模块,将网络拓扑结构解析后保存成字典的格式,字典中的key代表网络节点,key对应的value是一个列表,表示该节点所在边的另一端节点序列;S2、对网络节点进行随机游走,生成游走序列;S3、构建基于宽度学习系统的网络表征学习模型,将S2中生成的游走序列以及维数为K的表征向量作为输入,在特征向量层生成网络节点的特征向量,在增强向量层通过引入激活函数增强网络表征学习模型的非线性分类能力,最终实现基于文本的网络多标签分类。
【技术特征摘要】
1.一种基于宽度学习系统的快速网络表征学习算法,其特征在于具有如下步骤:S1、导入基于文本的网络图模块,将网络拓扑结构解析后保存成字典的格式,字典中的key代表网络节点,key对应的value是一个列表,表示该节点所在边的另一端节点序列;S2、对网络节点进行随机游走,生成游走序列;S3、构建基于宽度学习系统的网络表征学习模型,将S2中生成的游走序列以及维数为K的表征向量作为输入,在特征向量层生成网络节点的特征向量,在增强向量层通过引入激活函数增强网络表征学习模型的非线性分类能力,最终实现基于文本的网络多标签分类。2.根据权利要求1所述的基于宽度学习系统的快速网络表征学习算法,其特征在于:所述步骤S2中生成游走序列的具体步骤如下:假设随机游走的次数为N,在每次游走前,对网络节点的序列进行洗牌以保证其随机性,然后依次从每一个网络节点开始游走,到达指定长度L后,从下一个网络节点继续开始游走,直到最后一个网络节点,根据设定的游走次数N,对此过程迭代若干次,返回随机游走的路径集合。3.根据权利要求1所述的基于宽度学习系统的快速网络表征学习算法,其特征在于:所述步骤S3中基于宽度学习系统的网络表征学习模型的训练过程为:生成特征向量:...
【专利技术属性】
技术研发人员:左毅,蒋龙,李铁山,陈俊龙,马赫,
申请(专利权)人:大连海事大学,
类型:发明
国别省市:辽宁,21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。