System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种文献分类方法、装置、设备及存储介质制造方法及图纸_技高网

一种文献分类方法、装置、设备及存储介质制造方法及图纸

技术编号:40955645 阅读:2 留言:0更新日期:2024-04-18 20:32
本申请实施例涉及数据处理技术领域,具体涉及一种文献分类方法、装置、设备及存储介质,旨在对文献进行准确分类。所述方法包括:接收文献关系图、邻接矩阵、顶点特征矩阵以及顶点标签矩阵;使用粗化算法对所述文献关系图进行粗化处理,得到所述文献关系图对应的粗化图链;使用反粗化算法对所述粗化图链进行反粗化处理,得到反粗化图链;根据所述粗化图链以及所述反粗化图链,建立多尺度图Haar小波卷积神经网络;通过所述邻接矩阵、所述顶点特征矩阵以及所述顶点标签矩阵对所述多尺度图Haar小波卷积神经网络进行训练;在所述多尺度图Haar小波卷积神经网络训练完毕的情况下,得到所述文献关系图对应的文献分类结果。

【技术实现步骤摘要】

本申请实施例涉及数据处理,具体而言,涉及一种文献分类方法、装置、设备及存储介质


技术介绍

1、在对文献进行存储时,需要对文献进行数字化处理之后存储到文献数据库中,在文献数据库中,文献分类是实现精准文献检索、文献推荐和文献计量分析的关键前提和重要基础。相关技术中,通常使用图建模来表现文献之间的关联关系,再基于文献之间的关联关系,使用图神经网络对文献进行分类。

2、相关技术中在使用图神经网络对文献进行分类时,受限于图神经网络的性能,无法有效的消除噪声影响,无法很好地对文献进行准确分类,导致文献分类不够准确。


技术实现思路

1、本申请实施例提供一种文献分类方法、装置、设备及存储介质,旨在对文献进行准确分类。

2、本申请实施例第一方面提供一种文献分类方法,所述方法包括:

3、接收文献关系图、所述文献关系图对应的邻接矩阵、所述文献关系图对应的顶点特征矩阵以及所述文献关系图对应的顶点标签矩阵;

4、使用粗化算法对所述文献关系图进行粗化处理,得到所述文献关系图对应的粗化图链;

5、使用反粗化算法对所述粗化图链进行反粗化处理,得到反粗化图链;

6、根据所述粗化图链以及所述反粗化图链,建立多尺度图haar小波卷积神经网络;

7、通过所述邻接矩阵、所述顶点特征矩阵以及所述顶点标签矩阵对所述多尺度图haar小波卷积神经网络进行训练;

8、在所述多尺度图haar小波卷积神经网络训练完毕的情况下,得到所述文献关系图对应的文献分类结果。

9、可选地,在接收文献关系图、所述文献关系图对应的邻接矩阵、所述文献关系图对应的顶点特征矩阵以及所述文献关系图对应的顶点标签矩阵之前,所述方法还包括:

10、从文献数据库中获取文献数据;

11、以所述文献数据中的每篇文献作为一个顶点,以文献之间的引用关系作为所述顶点之间的边,构建所述文献关系图;

12、根据所述文献关系图中的每个所述顶点的特征,得到所述顶点特征矩阵;

13、根据所述文献关系图中的每个所述顶点之间的连接关系,得到所述邻接矩阵;

14、根据所述文献关系图中的已标注顶点的标签,得到所述顶点标签矩阵。

15、可选地,所述使用粗化算法对所述文献关系图进行粗化处理,得到所述文献关系图对应的粗化图链,包括:

16、对所述文献关系图进行初始化处理,得到第一级粗化图;

17、对所述第一级粗化图进行模块密度迭代优化,得到第二级粗化图;

18、逐级生成多个粗化图,在得到预设级数的所述粗化图后,由得到的所有的所述粗化图构成所述粗化图链,所述粗化图链的每个所述粗化图按照生成顺序进行排列。

19、可选地,所述对所述文献关系图进行初始化处理,得到第一级粗化图,包括:

20、将所述文献关系图中的每个顶点作为一个社团;

21、将每个所述社团的社团状态设置为未标记;

22、将社团状态为未标记的所述社团加入到未标记社团集合中,得到所述第一级粗化图。

23、可选地,对所述第一级粗化图进行模块密度迭代优化,得到第二级粗化图,包括:

24、确定所述第一级粗化图中的每个未标记的社团对应的所有邻居社团;

25、针对每个未标记的所述社团,将所述社团分别与每个所述邻居社团组成一个邻接社团对,得到多个所述邻接社团对;

26、确定每个所述邻接社团对中的所述社团以及所述邻居社团合并后的模块密度增益;

27、确定多个所述邻接社团对中对应的所述模块密度增益最大的所述邻接社团对;

28、在所述邻接社团对对应的所述模块密度增益大于预设的增益阈值的情况下,对所述邻接社团对中的所述社团执行社团合并操作;

29、在所述邻接社团对中的所述邻居社团的社团状态为未标记状态的情况下,将所述邻居社团的社团状态设置为已标记状态;

30、将所述邻居社团从未标记社团集合中删除;

31、迭代进行模块密度优化,在社团划分密度不再增加的情况下,停止迭代;

32、将进行社团合并后的所述第一级粗化图中的每个所述社团作为一个超顶点;

33、根据每个所述超顶点之间对应的连接关系,在每个所述超顶点之间添加连接边,得到所述第二级粗化图。

34、可选地,在将进行社团合并后的所述第一级粗化图中的每个所述社团作为一个超顶点之前,所述方法还包括:

35、在所述未标记社团集合中存在未标记的所述社团的情况下,通过预设的合并规则,对未标记的所述社团执行社团合并操作。

36、可选地,所述方法还包括:

37、构建相邻两级的所述粗化图之间的匹配矩阵;

38、在得到一个新的所述粗化图的情况下,根据所述粗化图中的每个顶点之间的连接关系,构建所述粗化图对应的邻接矩阵。

39、可选地,所述使用反粗化算法对所述粗化图链进行反粗化处理,得到反粗化图链,包括:

40、对所述粗化图链进行初始化处理;

41、使用所述反粗化算法,对初始化处理后的所述粗化图链进行反粗化处理,得到所述反粗化图链。

42、可选地,所述对所述粗化图链进行初始化处理,包括:

43、将所述粗化图链中最高一级的所述粗化图作为所述反粗化图链中的第一级反粗化图;

44、将与所述第一级反粗化图相邻的反粗化图作为第二级反粗化图;

45、将所述第一级反粗化图中的每个顶点作为父顶点;

46、将所述第二级反粗化图中的每个顶点作为子顶点;

47、将每个所述子顶点的状态设置为未标记状态。

48、可选地,所述使用所述反粗化算法,对初始化处理后的所述粗化图链进行反粗化处理,得到所述反粗化图链,包括:

49、从第一级反粗化图开始,确定所述第一级反粗化图中的每个父顶点在第二级反粗化图中对应的子顶点;

50、确定每个所述子顶点从对应的所述父顶点迁移到任意一个所述父顶点的迁移代价,所述子顶点的迁移目的地不包括所述子顶点原来所在的所述父顶点;

51、根据所述迁移代价,确定所述第二级反粗化图中的任意具有不同的所述父顶点的未标记的子顶点对的交换代价;

52、对所述第二级反粗化图中的所有具有不同所述父顶点的所述子顶点对的交换代价进行排序,得到交换代价排序结果;

53、根据所述交换代价排序结果,确定具有最大正收益的所述子顶点对;

54、交换所述子顶点对在所述第一级反粗化图中的所述父顶点;

55、将所述子顶点对中的每个所述子顶点的状态设置为标记状态;

56、在所有的所述子顶点的状态为所述标记状态的情况下,完成对所述第二级反粗化图的反粗化处理;

57、迭代生成反粗化图,在得到预设级数的所述反粗化图后,由得到的所有的所述反粗化图构成本文档来自技高网...

【技术保护点】

1.一种文献分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在接收文献关系图、所述文献关系图对应的邻接矩阵、所述文献关系图对应的顶点特征矩阵以及所述文献关系图对应的顶点标签矩阵之前,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述使用粗化算法对所述文献关系图进行粗化处理,得到所述文献关系图对应的粗化图链,包括:

4.根据权利要求3所述的方法,其特征在于,所述对所述文献关系图进行初始化处理,得到第一级粗化图,包括:

5.根据权利要求3所述的方法,其特征在于,对所述第一级粗化图进行模块密度迭代优化,得到第二级粗化图,包括:

6.根据权利要求5所述的方法,其特征在于,在将进行社团合并后的所述第一级粗化图中的每个所述社团作为一个超顶点之前,所述方法还包括:

7.根据权利要求3所述的方法,其特征在于,所述方法还包括:

8.根据权利要求1所述的方法,其特征在于,所述使用反粗化算法对所述粗化图链进行反粗化处理,得到反粗化图链,包括:

9.根据权利要求8所述的方法,其特征在于,所述对所述粗化图链进行初始化处理,包括:

10.根据权利要求8所述的方法,其特征在于,所述使用所述反粗化算法,对初始化处理后的所述粗化图链进行反粗化处理,得到所述反粗化图链,包括:

11.根据权利要求10所述的方法,其特征在于,在所有的所述子顶点的状态为所述标记状态的情况下,完成对所述第二级反粗化图的反粗化处理时,所述方法还包括:

12.根据权利要求1所述的方法,其特征在于,所述根据所述粗化图链以及所述反粗化图链,建立多尺度图Haar小波卷积神经网络,包括:

13.根据权利要求12所述的方法,其特征在于,所述根据所述粗化图对应的图Haar小波变换矩阵以及所述反粗化图对应的图Haar小波变换矩阵,建立所述多尺度图Haar小波卷积神经网络,包括:

14.根据权利要求12所述的方法,其特征在于,在根据所述粗化图对应的图Haar小波变换矩阵,构建所述粗化图链对应的多个图Haar小波卷积层时,所述方法还包括:

15.根据权利要求13所述的方法,其特征在于,在根据所述反粗化图对应的图Haar小波变换矩阵,构建所述反粗化图链对应的多个图Haar小波卷积层时,所述方法还包括:

16.根据权利要求1所述的方法,其特征在于,通过所述邻接矩阵、所述顶点特征矩阵以及所述顶点标签矩阵对所述多尺度图Haar小波卷积神经网络进行训练,包括:

17.根据权利要求16所述的方法,其特征在于,在将所述邻接矩阵、所述顶点特征矩阵以及所述顶点标签矩阵输入所述多尺度图Haar小波卷积神经网络中之前,所述方法还包括:

18.一种文献分类装置,其特征在于,所述装置包括:

19.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时,实现如权利要求1至17任一所述的方法中的步骤。

20.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如权利要求1至17任一所述的方法的步骤。

...

【技术特征摘要】

1.一种文献分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在接收文献关系图、所述文献关系图对应的邻接矩阵、所述文献关系图对应的顶点特征矩阵以及所述文献关系图对应的顶点标签矩阵之前,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述使用粗化算法对所述文献关系图进行粗化处理,得到所述文献关系图对应的粗化图链,包括:

4.根据权利要求3所述的方法,其特征在于,所述对所述文献关系图进行初始化处理,得到第一级粗化图,包括:

5.根据权利要求3所述的方法,其特征在于,对所述第一级粗化图进行模块密度迭代优化,得到第二级粗化图,包括:

6.根据权利要求5所述的方法,其特征在于,在将进行社团合并后的所述第一级粗化图中的每个所述社团作为一个超顶点之前,所述方法还包括:

7.根据权利要求3所述的方法,其特征在于,所述方法还包括:

8.根据权利要求1所述的方法,其特征在于,所述使用反粗化算法对所述粗化图链进行反粗化处理,得到反粗化图链,包括:

9.根据权利要求8所述的方法,其特征在于,所述对所述粗化图链进行初始化处理,包括:

10.根据权利要求8所述的方法,其特征在于,所述使用所述反粗化算法,对初始化处理后的所述粗化图链进行反粗化处理,得到所述反粗化图链,包括:

11.根据权利要求10所述的方法,其特征在于,在所有的所述子顶点的状态为所述标记状态的情况下,完成对所述第二级反粗化图的反粗化处理时,所述方法还包括:

12.根据权利要求...

【专利技术属性】
技术研发人员:胡克坤董刚曹其春杨宏斌
申请(专利权)人:苏州元脑智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1