【技术实现步骤摘要】
一种重启式随机游走的新型网络嵌入学习方法
本专利技术涉及一种网络嵌入方法,具体涉及一种重启式随机游走的新型网络嵌入学习方法。
技术介绍
网络数据形式可以自然地表达物体和物体间的联系,是我们生产生活中最为常见的一种信息载体,在我们的日常生活与工作中无处不在。例如,新浪微博数据、微信数据等构成了人与人之间的社交网络;城市之间的道路设施连接数据等构成了交通网络;淘宝、天猫、京东等购物平台数据构成了电商网络;论文之间的互相引用关系构成了引用网络,等等。基于网络数据的广泛存在,对这类网络信息进行研究与分析具有非常实际的应用价值和非常广泛的应用场景,如节点分类、链接预测、社区发现、知识图谱、推荐系统、相似度检测等等。在有关网络分析与挖掘的技术研究中,一个重要的问题就是如何合适的表示网络的拓扑结构信息,也就是网络嵌入。传统的网络表示一般使用高维的稀疏向量,但是高维稀疏的表示也成为了人们使用统计学习方法时的局限所在,因为高维的向量将会花费更多的运行时间和计算空间。尤其是近年以来,伴随着信息技术的蓬勃发展和大数据时代的到来,大量不同领域、不同地域、不同时域的信息形成了规模庞大、错综 ...
【技术保护点】
1.一种重启式随机游走的新型网络嵌入学习方法,其特征在于,包括以下步骤:步骤1,获取实体及其关系信息建立网络数据;步骤2,重复迭代进行游走和训练;所述步骤2中包括重启式随机游走和网络嵌入训练两部分。
【技术特征摘要】
1.一种重启式随机游走的新型网络嵌入学习方法,其特征在于,包括以下步骤:步骤1,获取实体及其关系信息建立网络数据;步骤2,重复迭代进行游走和训练;所述步骤2中包括重启式随机游走和网络嵌入训练两部分。2.如权利要求1所述的方法,其特征在于,在所述步骤1中,所述获取实体及其关系信息建立网络数据的具体方式为,对输入的各种各样的数据及其之间的关系进行清洗和过滤,然后抽取数据中的实体作为网络中的节点,实体之间的关系作为网络中的边,将数据构建成网络形式,并向下一模块进行推送。3.如权利要求2所述的方法,其特征在于,在所述步骤2中,所述重复迭代进行游走和训练的具体方式为:步骤2-1,将网络的全体节点打乱顺序排成一个序列,依次从每一个节点出发,执行重启式随机游走和网络嵌入训练:步骤2-2,从一个节点出发进行重启式随机游走,产生一个节点序列;步骤2-2,用该节点序列进行网络嵌入训练;步骤2-3,重复以上操作若干轮次,直至达到给定轮次或者训练误差达到给定精度。4.如权利要求3所述的方法,其特征在于,在所述步骤2-2中,所述从一个节点出发进行重启式随机游走,产生一个节点序列的具体步骤为:步骤3-1,将选择的节点标记为起始节点;步骤3-2,从起始节点出发,从其邻居节点中随机选择一个节点,并转移到该节点中,记为当前节点;步骤3-3,若游走长度达到给定的长度,则进入步骤3-6,停止游走,否则继续执行,所述...
【专利技术属性】
技术研发人员:李建欣,何雨,彭浩,张帅,胡春明,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。