【技术实现步骤摘要】
一种城市异构节点分类的图网络结构方法
本专利技术涉及一种城市异构节点分类的图网络结构方法,属于大数据以及智慧城市网络构建
技术介绍
在智慧城市建设中,建立事件处理的公共服务系统是重要的一环。这一系统被应用于市长专线等政府平台,接受市民反映的各种问题。系统的具体流程包括对于每日反映的事件,先由相关人员根据事件的内容和性质进行分类,再根据类别将事件派发到对应的部门。但是由于这种人工分类方法的分类准确率低,效率不高,如何对事件进行高效的分类仍存在挑战。目前的城市事件自动化分类方法主要基于文本数据,没有综合考虑其他类型的数据,例如城市地点数据、网站数据、移动APP数据、和监控抓拍的视频数据。另一方面,城市事件具有动态变化的特性,导最新的事件层出不穷,而由于这些事件的标签数据不足,并且现有的分类方法需要大量的标签数据来训练模型,导致了在处理最新出现的事件时,无法获得较高的准确率。总之,上述已有的城市事件自动化分类技术虽然比人工分类的方法具有更高的效率,然而在处理最新事件时,仍然存在处理数据单一,标签数据不足的 ...
【技术保护点】
1.一种城市异构节点分类的图网络结构方法,其特征在于:包括如下步骤:/n步骤一:获取构建城市异构图所需的数据以及标签信息并构建城市异构图;/n步骤一,具体包括如下子步骤:/n步骤1.1:收集投诉过事件市民的相关数据以及市民所在地区范围内所有活跃设施的地理位置坐标序列;/n其中,市民的相关数据包括投诉事件类型、微博或各种地图软件的账号;/n步骤1.2:基于步骤1.1中微博或各种地图软件的LBS获取市民的轨迹数据;/n步骤1.3:根据步骤1.1中所有活跃设施的地理位置坐标收集对应设施的标签信息;/n步骤1.4:将步骤1.2轨迹数据中的市民和步骤1.3中的活跃设施分别抽象为用户节 ...
【技术特征摘要】
1.一种城市异构节点分类的图网络结构方法,其特征在于:包括如下步骤:
步骤一:获取构建城市异构图所需的数据以及标签信息并构建城市异构图;
步骤一,具体包括如下子步骤:
步骤1.1:收集投诉过事件市民的相关数据以及市民所在地区范围内所有活跃设施的地理位置坐标序列;
其中,市民的相关数据包括投诉事件类型、微博或各种地图软件的账号;
步骤1.2:基于步骤1.1中微博或各种地图软件的LBS获取市民的轨迹数据;
步骤1.3:根据步骤1.1中所有活跃设施的地理位置坐标收集对应设施的标签信息;
步骤1.4:将步骤1.2轨迹数据中的市民和步骤1.3中的活跃设施分别抽象为用户节点和位置节点,基于轨迹数据构建城市异构图;
步骤二:对城市异构图进行预处理,获得输入数据的集合,具体包括如下子步骤:
步骤2.1:在城市异构图中,以用户节点为中心,R为半径提取一个局部子图;
步骤2.2:将局部子图中所有节点的标签抽取出来,组成一个和局部子图对应的节点标签集,并将该节点标签集中的标签进行分类判决为两类标签;
其中,节点标签集中包括已知事件的标签和最新事件的标签;
步骤2.3:将步骤2.1提取的局部子图和步骤2.2组成的节点标签集组合为一个数据对;
步骤2.4:再重复步骤2.1到步骤2.3共K-1次,共获得包含K个数据对的输入数据集;
至此,经过步骤一和步骤二,获得了输入数据集,用于后续预训练和微调;
步骤三:根据得到的输入数据集构建前预训练模型;
所述前预训练模型的功能为:通过自监督的方式挖掘节点之间的结构信息;
其中,构建的前预训练模型包括图分割模块、中心子图特征提取模块、上下文子图特征提取模块和自监督学习模块;
其中,中心子图特征提取模块包括GCN3编码单元和中心节点提取单元;上下文子图特征提取模块包括GCN4编码单元和池化单元;GCN3和GCN4均为图卷积神经网络模型;
前预训练模型中各模块的连接关系是:
图分割模块的输出分别和中心子图特征提取模块以及上下文子图特征提取模块的输入相连,中心子图特征提取模块以及上下文子图特征提取模块的输出都和自监督学习模块的输入相连;
前预训练模型中各模块的功能是:
图分割模块的功能是对输入数据集中的所有局部子图进行批处理,将其中的每个图都分割为中心子图和上下文子图;自监督学习模块的功能是通过优化损失函数来编码结构信息;中心子图特征提取模块的功能是对批处理后的所有中心子图进行编码表示,提取每个中心子图的特征表示;上下文子图特征提取模块的功能是编码批处理后的所有上下文子图,提取每个上下文子图的特征表示;
其中,中心子图是局部子图中以用户节点为中心,半径小于等于r的部分;上下文子图是局部子图中以用户节点为中心,半径大于等于r的部分;中心子图的特征表示就是用户节点的特征表示;上下文子图的特征表示就是距用户节点距离为r的所有节点的特征表示的平均;r是人为设定的一个半径值,用于确定中心子图和上下文子图的大小并且0<r<R;
其中,构建前预训练模型,具体包括如下子步骤:
步骤3.1:调用图分割模块对局部子图进行批处理,输出批处理后的中心子图和上下文子图;
步骤3.2:调用中心子图特征提取模块,基于步骤3.1得到的批处理的中心子图,提取每一个批处理过程中所有中心子图的特征表示;
其中,调用GCN3单元编码中心子图;调用中心节点提取单元获得中心子图的特征表示;
步骤3.3:调用上下文子图特征提取模块,基于步骤3.1得到的批处理的上下文子图,提取每一个批处理过程中所有上下文子图的特征表示;
其中,调用GCN4单元编码上下文子图;调用池化单元获得上下文子图的特征表示;
步骤3.4:基于步骤3.2和步骤3.3得到的中心子图的特征表示以及上下文子图的特征表示,计算损失L1,计算公式如式(1)所示:
其中,L1是当中心子图和上下文子图分别来自同一张局部子图G时的损失;和cv分别是来自同一张局部子图G的中心子图和上下文子图的特征表示,v表示局部子图G的中心节点,K表示当前处于图神经网络的第K层;
步骤3.5:基于步骤3.2和步骤3.3得到的中心子图的特征表示以及上下文子图的特征表示,计算损失L2,计算公式如式(2)所示:
其中,L2是当中心子图和上下文子图分别来自不同的局部子图G和G'时的损失;是局部子图G的中心子图的特征表示,v表示局部子图G的中心节点,K表示当前处于第K个图神经网络层;是局部子图G'的上下文子图的特征表示,v'表示局部子图G'的中心节点;
步骤3.6:将步骤3.4和步骤3.5得到的损失值L1和L2代入公式(3),调用自监督学习模块,计算损失L,并利用随机梯度下降法更新步骤3.2到步骤3.3中两个特征提取模块的参数;
L=L1+αL2(3)
其中,L是综合了L1和L2的整体损失;α是人工设定的超参数,取值范围在0到1之间;
步骤3.7:跳回到步骤3.1继续训练,直到L基本保持不变,跳出循环,跳至步骤四;
至此,从步骤3.1到步骤3.7,完成了前预训练模型的构建;
步骤四:将前预训练模型部分迁移到后预训练模型中,再根据输入数据集构建后预训练模型;
其中,后预训练模型包括特征提取模块、线性层模块和softmax层模块;特征提取模块包括GCN2编码单元、中心节点提取单元以及池化单元;
后预训练模型中各模块的连接关系是:
特征提取模块和线性层模块相连;线性层模块和softmax层模块相连;
后...
【专利技术属性】
技术研发人员:高扬,韩晓宇,王竞,王丹,
申请(专利权)人:内蒙古众城信息科技有限公司,
类型:发明
国别省市:内蒙古;15
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。