一种基于引文网络结构的关键词逆向传播算法制造技术

技术编号:38712295 阅读:23 留言:0更新日期:2023-09-08 14:55
本发明专利技术提供了一种基于引文网络结构的关键词逆向传播算法,包括如下步骤:建立弹簧电荷模型,并进行力导向布局处理,建立力导向布局图;使用逆向传播算法,建立关键词传播模型,得到关键词权重变化对照曲线;使用力导向布局图,构建引文网络模型;对力导向布局图进行迭代计算,直至力导向布局图中的能量状态到达最低值;对引文网络进行迭代计算的同时,调整引文网络模型中的关键词权重,计算得到收敛的引文网络布局图。本发明专利技术有益效果:以整个网络为主体,由被引文献向施引文献以一定概率选择其拥有的关键词并沿着网络向后传播,在保留文本聚类思想的同时,加大对于关键词的权重,通过力导向布局,得到了清晰的可视化数据效果。得到了清晰的可视化数据效果。得到了清晰的可视化数据效果。

【技术实现步骤摘要】
一种基于引文网络结构的关键词逆向传播算法


[0001]本专利技术属于引文网络领域,尤其是涉及一种基于引文网络结构的关键词逆向传播算法。

技术介绍

[0002]引文网络是由文献间引用和被引用的关系构成的集合,这些文献资料包括科技期刊、专利文献、会议论文集、科技报告和学位论文等多种形式,其较好地描述了科学领域的发展、学科间的关系。随着现代信息技术的发展,文献著作数量迅速增加,引文网络已经形成了一个超大规模的复杂网络系统,并吸引了越来越多的关注。由于引文网络包含了多个领域的研究成果,代表了学术研究中重要的知识宝库,其已经成为研究的重要介质。
[0003]聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。聚类(Cluster)分析是由若干模式(Pattern)组成的,通常,模式是一个度量(Measurement)的向量,或者是多维空间中的一个点。聚类分析以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。
[0004]基于文本的聚类算法的输入通常是将语料进行向量化,然后通过计算不同语料之间的相似度来作为文本与文本之间的相似度。传统的文献聚类算法通常将文献的摘要以及关键词等作为语料输入,这样的聚类算法得到的结果难以保证完整的引文网络结构。所以在可视化展示时,会导致不同簇之间的文献相互交叉引用,难以得到较好的可视化效果。

技术实现思路

[0005]有鉴于此,本专利技术旨在提出一种一种基于引文网络结构的关键词逆向传播算法,以得到完整的引文网络结构,从而得到更好可视化效果。
[0006]为达到上述目的,本专利技术的技术方案是这样实现的:
[0007]一种基于引文网络结构的关键词逆向传播算法,包括如下步骤:
[0008]S1:建立弹簧电荷模型,并进行力导向布局处理,建立力导向布局图;
[0009]S2:使用逆向传播算法,建立关键词传播模型,得到关键词权重变化对照曲线;
[0010]S3:使用步骤S1中建立的力导向布局图,构建引文网络模型;
[0011]S4:对力导向布局图进行迭代计算,直至力导向布局图中的能量状态到达最低值;
[0012]S5:使用步骤S4中的迭代计算方式,代替步骤S3中建立的引文网络模型中的迭代计算方法,进行迭代计算;
[0013]S6:在步骤S5中对引文网络进行迭代计算的同时,使用步骤S2得到的关键词权重变化对照曲线,调整引文网络模型中的关键词权重;
[0014]S7:通过步骤S1至S6计算得到,收敛的引文网络布局图。
[0015]进一步的,步骤S1中建立力导向布局图的具体过程如下:
[0016]S101:将弹簧电荷模型中每一个具有能量的放电粒子作为力导向布局中的一个节点;
[0017]S102:根据粒子与粒子之间的库伦力以及胡克引力,计算得到两个粒子之间的相关作用力关联,将得到的相关作用力关联作为两个节点之间的连接关系,得到力导向布局中的边;
[0018]S103:使用步骤S101和S102中得到的节点与边建立力导向布局图。
[0019]进一步的,步骤S2中建立关联词传播模型的过程如下:
[0020]S201:建立神经网络模型,将关键词数据输入神经网络进行运算,计算每个神经元的输出,并生成最终的输出结果;
[0021]S202:计算实际输出和目标输出之间的误差值,将误差值代入误差函数,计算得到关键词权重与偏置的导数;
[0022]S203:将关键词权重与偏置的导数传递回网络的前序层次,以更新前序层次上的关键词权重与偏置;
[0023]S204:使用原有的关键词权重与偏置数据,以及更新后的关键词权重与偏置,排列得到实际变化曲线与目标变化曲线,进而得到关键词变化对照曲线。
[0024]进一步的,步骤S3中建立引文网络模型的步骤如下:
[0025]S301:收集一定数量的学术文献数据,并将学术文献数据转换为交互数据格式;
[0026]S302:从文献数据中提取出需要的信息作为关键词;
[0027]S303:构建一个有向图,其中每个节点表示一篇学术文献,每条边表示该篇文章中对其他文献的引用链接;
[0028]S304:通过聚类算法划分网络中的子群,识别核心节点和关键文献;
[0029]S305:迭代计算得到引文网络布局图。
[0030]进一步的,步骤S4中对力导向布局图进行迭代计算的过程如下:
[0031]S401:输入迭代次数、数据节点、与数据节点对应的边;
[0032]S402:在每一次迭代中,遍历所有数据节点,调用库伦斥力函数,进行递归计算,得到所有数据节点之间的静电斥力;
[0033]S403:遍历与所有数据节点相对应的边,调用胡克引力函数,对步骤S402中得到静电斥力数据进行递归计算,得到新的静电斥力数据;
[0034]S404:再次遍历所有数据节点,调用位置函数来更新数据节点的位置,位置函数的参数包括数据节点当前的坐标以及步骤S403中得到的新的静电斥力数据;
[0035]S405:返回更新后的数据节点得到位置数据。
[0036]相对于现有技术,本专利技术所述的一种基于引文网络结构的关键词逆向传播算法具有以下有益效果:
[0037]本专利技术所述的一种基于引文网络结构的关键词逆向传播算法,以整个网络为主体,由被引文献向施引文献以一定概率选择其拥有的关键词并沿着网络向后传播,在保留文本聚类思想的同时,加大对于关键词的权重,通过力导向布局,得到了清晰的可视化数据效果。
附图说明
[0038]构成本专利技术的一部分的附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0039]图1为本专利技术实施例所述的一种基于引文网络结构的关键词逆向传播算法流程示意图;
[0040]图2为本专利技术实施例所述的通过现有引文网络得到的可视化网络图示意图;
[0041]图3为本专利技术实施例所述的通过本专利技术改良后的引文网络得到的可视化网络图示意图。
具体实施方式
[0042]需要说明的是,在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。
[0043]下面将参考附图并结合实施例来详细说明本专利技术。
[0044]一种基于引文网络结构的关键词逆向传播算法,包括如下步骤:
[0045]S1:建立弹簧电荷模型,并进行力导向布局处理,建立力导向布局图;
[0046]S2:使用逆向传播算法,建立关键词传播模型,得到关键词权重变化对照曲线;
[0047]S3:使用步骤S1中建立的力导向布局图,构建引文网络模型;
[0048]S4:对力导向布局图进行迭代计算,直至力导向布局图中的能量状态到达最低值;
[0049]S5:使用步骤S4中的迭代计算方式,代替步骤S3中建本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于引文网络结构的关键词逆向传播算法,其特征在于:包括如下步骤:S1:建立弹簧电荷模型,并进行力导向布局处理,建立力导向布局图;S2:使用逆向传播算法,建立关键词传播模型,得到关键词权重变化对照曲线;S3:使用步骤S1中建立的力导向布局图,构建引文网络模型;S4:对力导向布局图进行迭代计算,直至力导向布局图中的能量状态到达最低值;S5:使用步骤S4中的迭代计算方式,代替步骤S3中建立的引文网络模型中的迭代计算方法,进行迭代计算;S6:在步骤S5中对引文网络进行迭代计算的同时,使用步骤S2得到的关键词权重变化对照曲线,调整引文网络模型中的关键词权重;S7:通过步骤S1至S6计算得到,收敛的引文网络布局图。2.根据权利要求1所述的一种基于引文网络结构的关键词逆向传播算法,其特征在于:步骤S1中建立力导向布局图的具体过程如下:S101:将弹簧电荷模型中每一个具有能量的放电粒子作为力导向布局中的一个节点;S102:根据粒子与粒子之间的库伦力以及胡克引力,计算得到两个粒子之间的相关作用力关联,将得到的相关作用力关联作为两个节点之间的连接关系,得到力导向布局中的边;S103:使用步骤S101和S102中得到的节点与边建立力导向布局图。3.根据权利要求1所述的一种基于引文网络结构的关键词逆向传播算法,其特征在于:步骤S2中建立关联词传播模型的过程如下:S201:建立神经网络模型,将关键词数据输入神经网络进行运算,计算每个神经元的输出,并生成最终的输出结果;S202:计算实际输出和目标输出之间的误差值,将误差值代入误差函...

【专利技术属性】
技术研发人员:邹文韬
申请(专利权)人:紫光云技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1