The invention provides a connection information regularization system, a graph feature extraction system, a graph classification system and a graph classification system based on the adjacency matrix. By concentrating the connection information elements in the adjacency matrix corresponding to the graph into a specific diagonal area of the adjacency matrix, the non-connection information elements are reduced in advance, so that the use is large. The time complexity is greatly reduced when small fixed windows traverse the diagonal region to capture all the sub-graph structures of corresponding sizes in the graph; furthermore, the sub-graph structure is extracted along the diagonal direction by using the filter matrix, and then the larger sub-graph structure is extracted by using the cascaded convolution neural network, which reduces greatly on the one hand. Computational complexity and computational complexity are reduced, the limitation of computational complexity and window size are solved, and the sub-graph structure of large multi-vertex can be captured through a small window, and the deep features from the implicit correlation structure of vertices and edges can be captured, which improves the accuracy and speed of graph classification.
【技术实现步骤摘要】
一种基于邻接矩阵的连接信息规整系统、图特征提取系统、图分类系统和方法
本专利技术属于人工智能领域,具体涉及一种基于邻接矩阵的连接信息规整系统、图特征提取系统、图分类系统和方法。
技术介绍
图论中的图(graph)是由若干给定的点及连接两点的线所构成的图形,这种图形通常用来描述某些事物之间的某种特定关系,用点代表事物,用连接两点的线表示相应两个事物间具有某种关系。图论中的图(Graph)G是一个有序二元组(V,E),其中V称为顶点集(vertexset),即图中所有顶点组成的集合,E称为边集(edgeset),即所有顶点之间的边组成的集合。简单的说,顶点表示事物,边表示事物之间的关系。图(graph)是一种非网格数据(non-griddata),这类数据的特点是,在具体的场景中维度(dimension)是不确定的,并且维度高且无上限,所述的图的维度(dimension)是指图的顶点的数量。例如化学结构式可以对应一个图(graph),其中原子即为图(graph)中的顶点,原子间的化学键即为图(graph)中的边。一个分子的维度为该分子中包含的原子数量,例如一个分子包含100个原子组成,则该分子的维度为100。在一个分子的集合中,每个分子由数量不定的原子构成,故其维度是不确定的。现实中蛋白质等复杂结构往往由几十甚至上百个原子构成,其维度就高达几十甚至上百。又例如社交网络也可以对应一个图(graph),其中,人即图(graph)中的顶点,人与人之间的关系即图(graph)中的边,社交网络的维度会更高且更加复杂,一般较大的社交网络能有几千个顶点,几万条边,维度就高达 ...
【技术保护点】
1.一种在计算机环境中基于邻接矩阵的连接信息规整系统,其特征在于:所述的连接信息规整系统用于将图对应的第一邻接矩阵中的全部顶点进行重新排序,得到第二邻接矩阵,所述第二邻接矩阵中的连接信息元素集中分布在所述第二邻接矩阵的宽度为n的对角线区域,其中n为正整数,n≥2且n
【技术特征摘要】
2017.06.28 CN 2017105104744;2017.07.01 CN 201710521.一种在计算机环境中基于邻接矩阵的连接信息规整系统,其特征在于:所述的连接信息规整系统用于将图对应的第一邻接矩阵中的全部顶点进行重新排序,得到第二邻接矩阵,所述第二邻接矩阵中的连接信息元素集中分布在所述第二邻接矩阵的宽度为n的对角线区域,其中n为正整数,n≥2且n<|V|,所述的|V|为第二邻接矩阵的行数或列数;所述第二邻接矩阵的对角线区域由以下元素组成:正整数i从1遍历至|V|,当i>max(n,|V|-n)时,选取第i行中第(i-n+1)到|V|列的元素;当i≤n,选取第i行中第0至i+n-1列的元素;当max(n,|V|-n)≥i≥min(|V|-n,n),则第i列中,选取第(i-n+1)列到第(i+n-1)列的元素;所述的连接信息元素是图中的边在邻接矩阵中对应的元素;所述的图为图论中的图;优选的,如果所述的图中边上没有权重,所述的连接信息元素的值为1,非连接信息元素的值为0;更优选的,如果所述的图中边上带有权重,则所述的连接信息元素的值为边的权重值,非连接信息元素的值为0;优选的,所述对角线区域指矩阵中从左上角至右下角的对角线区域;优选的,所述第二邻接矩阵的对角线区域是使用一个尺寸为n×n的扫描矩形框沿所述第二邻接矩阵的对角线扫描一遍所经过的区域;更优选的,所述的扫描过程如下:首先,将所述扫描矩形框的左上角与第二邻接矩阵的左上角重合;然后每次将所述扫描矩形框往右方和下方各移动一个元素格,直至所述扫描矩形框的右下角与所述第二邻接矩阵的右下角重合。2.一种在计算机环境中基于邻接矩阵的图特征提取系统,其特征在于:所述的图特征提取系统基于图的邻接矩阵抽取出图的特征,所述的特征直接对应支持分类的子图结构,所述的特征以至少一个向量的形式呈现,每一个向量对应一种混合态在图中的分布情况;所述的图特征提取系统包括特征生成模块和权利要求1所述的连接信息规整系统;其中:所述的连接信息规整模块用于将图对应的第一邻接矩阵中的全部顶点进行重新排序,得到第二邻接矩阵;所述的特征生成模块基于所述的第二邻接矩阵,生成图的特征,所述的特征直接对应支持分类的子图结构,每一个向量对应一种混合态在图中的分布情况;所述的图、子图均为图论中的图;优选的,所述的特征生成模块利用过滤矩阵生成图的特征,所述的过滤矩阵为正方形矩阵;更优选的,所述的特征生成模块利用至少一个过滤矩阵,沿所述第二邻接矩阵的对角线区域进行过滤操作,得到至少一个向量,所述的至少一个向量对应于所述的图的特征,所述的特征直接对应支持分类的子图结构,每一个向量对应一种混合态在图中的分布情况;优选的,所述过滤矩阵的尺寸为n×n;优选的,所述的分布情况是指图中出现该混合态中的子图结构的可能性;优选的,每一个所述的混合态代表任意多个子图结构对应的邻接矩阵的线性加权;更优选的,所述的线性加权是指每一个子图的邻接矩阵乘以该邻接矩阵对应的权值,然后对位相加到一起,得到一个与子图的邻接矩阵相同大小的矩阵;优选的,所述的过滤操作是利用所述的过滤矩阵对所述第二邻接矩阵对位的矩阵内积的加和,通过激活函数得到一个值,让过滤矩阵沿所述第二邻接矩阵的对角线方向移动,从而得到一组值,形成一个向量,该向量对应一种子图结构在图中的分布情况;更优选的,所述的激活函数为sigmoid函数、ReLU激活函数、pReLU函数;优选的,所述的特征生成模块利用不同的过滤矩阵,进行所述的过滤操作;优选的,所述过滤矩阵中每一个元素的初始值分别从高斯分布中取出的随机变量的值;优选的,所述的过滤矩阵中的元素为大于等于-1、小于等于1的实数;更优选的,所述的过滤矩阵中的元素为大于等于0、小于等于1的实数;优选的,所述的特征生成模块参与机器学习过程,所述机器学习过程用于调整所述过滤矩阵的元素的值;优选的,所述的机器学习过程是利用反向传播,利用分类的损失值,计算梯度值,进一步调节过滤矩阵中的各个元素的值。3.一种在计算机环境中基于邻接矩阵的图分类系统,其特征在于:所述的图分类系统包括类别标注模块和权利要求2所述的图特征提取系统,所述的类别标注模块基于所述图特征提取系统生成的特征对图进行类别标注,输出图的类别;所述的图为图论中的图;优选的,所述的类别标注模块计算出图属于各个分类标签的可能性,并将可能性最高的分类标签标注为图的类别,完成图的分类;优选的,所述的类别标注模块利用分类算法计算出图属于各个分类标签的可能性,并将可能性最高的分类标签标注为图的类别,完成图的分类;更优选的,所述的分类算法选自kNN、线性分类算法中的任意一种或任意多种。4.根据权利要求3所述的图分类系统,其特征在于:所述的图分类系统还进一步包含层叠CNN模块,所述的层叠CNN模块基于所述的图特征提取系统生成的特征进行处理,融合所述的特征对应的支持分类的子图结构,生成包含图中更大子图结构的特征,所述的更大子图结构是指顶点个数多于n的子图结构;优选的,所述的层叠CNN模块包括卷积子模块和池化子模块;所述的卷积子模块使用至少一个卷积层基于所述的图特征提取系统生成的特征进行卷积操作,融合所述的特征对应的支持分类的子图结构,得到至少一个向量作为卷积结果;第一个卷积层的输入为权利要求2所述的图特征提取系统生成的特征,如果有多个卷积层,每一个卷积层的输入为前一个卷积层的输出结果,每一个卷积层的输出结果均为至少一个向量,每一个卷积层使用至少一个过滤矩阵进行卷积操作,最后一个卷积层的卷积结果输出至所述的池化子模块;所述的过滤矩阵为正方形矩阵;每一个所述卷积层中所述过滤矩阵的行数与输入该卷积层的向量的数量相同;优选的,所述的过滤矩阵中的元素为大于等于-1、小于等于1的实数;更优选的,所述的过滤矩阵中的元素为大于等于0、小于等于1的实数;所述的池化子模块用于对所述卷积子模块得到的矩阵进行池化操作,得到至少一个向量作为池化结果输出至所述的类别标注模块,对图进行类别标注,输出图的类别,所述池化结果包含图中更大子图结构的特征;所述的更大子图结构是指顶点个数多于n的子图结构;优选的,所述的池化操作选自最大池化操作、平均池化操作。5.根据权利要求3所述的图分类系统,其特征在于:所述的图分类系统还进一步包含独立池化模块和卷积池化模块;所述的独立池化模块用于对所述的图特征提取系统生成的特征进行池化操作,得到至少一个向量作为第一池化结果输出至所述的类别标注模块;所述的卷积池化模块对输入的权利要求2所述的图特征提取系统生成的特征进行卷积和池化处理,融合所述的特征对应的支持分类的子图结构,生成包含图中更大子图结构特征的第二池化结果,将其输出至所述的类别标注模块;所述的类别标注模块根据所述第一池化结果和第二池化结果对图进行类别标注,输出图的类别;所述的更大子图结构是指顶点个数多于n的子图结构;优选的,所述的卷积池化模块包含卷积子模块和池化子模块;所述的卷积子模块使用至少一个过滤矩阵对输入进行卷积操作,融合所述的特征对应的支持分类的子图结构,得到至少一个向量作为卷积结果传递给池化子模块;所述的池化子模块对所述的卷积结果进行池化操作,得到至少一个向量作为第二池化结果,所述第二池化结果包含图中更大子图结构的特征,将所述的池化结果输出至所述的类别标注模块;所述的过滤矩阵为正方形矩阵;每一个所述卷积层中所述过滤矩阵的行数与输入该卷积层的向量的数量相同;优选的,所述的过滤矩阵中的元素为大于等于-1、小于等于1的实数;更优选的,所述的过滤矩阵中的元素为大于等于0、小于等于1的实数;优选的,所述的池化操作选自最大池化操作、平均池化操作。6.根据权利要求3所述的图分类系统,其特征...
【专利技术属性】
技术研发人员:罗智凌,尹建伟,吴朝晖,邓水光,李莹,吴健,
申请(专利权)人:浙江大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。