一种基于正则流自动编码器的联合嵌入模型的构建方法技术

技术编号：24169910 阅读：57 留言：0更新日期：2020-05-16 02:36

本发明专利技术属于机器学习、人工智能技术领域，更具体地，涉及一种基于正则流自动编码器的联合嵌入模型的构建方法。本发明专利技术的目的，就是创造一个新的属性网络低维嵌入的模型，这个模型不仅解决了现有技术的缺点，同时在性能上比前人的工作都要好。为此，本发明专利技术提出了F‑CAN，一种基于正则流的联合嵌入模型。与以往的算法不同，该模型虽然也以属性网络的拓扑结构以及属性信息作为输入，但不仅仅输出节点的低维表达，同时输出属性的低维表达，而且两者都处于同一个空间内。另外，针对联合嵌入模型中关于后验概率假设过于简单的问题，本文提出了双正则流的方法，增加了模型的参数，使得后验概率假设更容易拟合现实后验概率，从而获得更好的性能。

A construction method of joint embedding model based on regular stream automatic encoder

全部详细技术资料下载

【技术实现步骤摘要】
一种基于正则流自动编码器的联合嵌入模型的构建方法
本专利技术属于机器学习、人工智能
，更具体地，涉及一种基于正则流自动编码器的联合嵌入模型的构建方法。
技术介绍
属性网络作为一种最重要的网络，在许多领域都随处可见，例如近年来迅速发展的在线社交网络，电商平台的用户网络，以及学术领域的网络等等，都可以抽象为属性网络。在这些网络上进行数据挖掘之后，能够进行商品推荐、用户画像、社群发现等一系列具有商业价值的应用。而如何表示网络则对数据挖掘任务至关重要。为了解决上述问题，目前提出了一些属性网络嵌入算法，包括标记感知嵌入、加速属性网络嵌入、半监督属性网络嵌入等等。这些算法利用了网络的拓扑结构以及节点的属性信息，学习出该网络下每个节点的低维嵌入。一旦每个节点的低维空间下的表达都能学习出来，那么节点之间的相似性计算将会相当容易，我们只需要计算其内积，又或者是余弦相似性。我们知道内积又或者余弦值的计算与维数有关，因此无论是从结构性以及计算方便性，低维嵌入都是属性网络挖掘中必不可少的一步。然而，上述现有技术拥有许多缺点。首...

【技术保护点】
1.一种基于正则流自动编码器的联合嵌入模型的构建方法，其特征在于，包括以下步骤：/nS1.定义符号与目标：假设网络中节点和属性的数目分别为N和F，那么一个属性网络可以通过两个矩阵来表示：邻接矩阵

【技术特征摘要】
1.一种基于正则流自动编码器的联合嵌入模型的构建方法，其特征在于，包括以下步骤：
S1.定义符号与目标：假设网络中节点和属性的数目分别为N和F，那么一个属性网络可以通过两个矩阵来表示：邻接矩阵以及属性矩阵其中A的每一行代表对应节点的出度，B的每一行代表对应节点所具有的属性；于是目标就是希望通过所建立的模型来学习到这个网络在低维下的表达：节点嵌入矩阵以及属性嵌入矩阵其中D代表低维空间的维数；N的每一行代表对应节点在低维空间下的表示，V的每一行代表对应属性在低维空间下的表示；
S2.建立联合嵌入模型；
S21.为了获得较好的N和V，希望它们与已观测到的A和B的联合分布pθ(A，B，N，V)的边缘分布pθ(A，B)最大：obj：＝maxθpθ(A，B)，其中θ是概率分布参数；使用对数边缘分布作为目标：obj：＝maxθlogpθ(A，B)；
S22.分解logpθ(A，B)：

其中qφ代表假设后验概率，φ为后验概率分布参数，为期望，DKL为KL距离；
S23.由KL距离的性质可知，KL距离非负，且值为0当且仅当qφ等于pθ，于是转而优化下界下界可以重写为：

其中假设qφ和pθ都是平均场分布：

S24.最终优化的目标，也即损失函数为：

2.根据权利要求1所述的基于正则流自动编码器的联合嵌入模型的构建方法，其特征在于，使用双正则流的方法，增加模型的参数；包括以下步...

【专利技术属性】
技术研发人员：梁上松，欧阳卓，
申请(专利权)人：中山大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人