一种基于引文网络结构的关键词逆向传播算法制造技术

技术编号：38712295 阅读：23 留言：0更新日期：2023-09-08 14:55

本发明专利技术提供了一种基于引文网络结构的关键词逆向传播算法，包括如下步骤：建立弹簧电荷模型，并进行力导向布局处理，建立力导向布局图；使用逆向传播算法，建立关键词传播模型，得到关键词权重变化对照曲线；使用力导向布局图，构建引文网络模型；对力导向布局图进行迭代计算，直至力导向布局图中的能量状态到达最低值；对引文网络进行迭代计算的同时，调整引文网络模型中的关键词权重,计算得到收敛的引文网络布局图。本发明专利技术有益效果：以整个网络为主体，由被引文献向施引文献以一定概率选择其拥有的关键词并沿着网络向后传播，在保留文本聚类思想的同时，加大对于关键词的权重，通过力导向布局，得到了清晰的可视化数据效果。得到了清晰的可视化数据效果。得到了清晰的可视化数据效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于引文网络结构的关键词逆向传播算法

[0001]本专利技术属于引文网络领域，尤其是涉及一种基于引文网络结构的关键词逆向传播算法。

技术介绍

[0002]引文网络是由文献间引用和被引用的关系构成的集合，这些文献资料包括科技期刊、专利文献、会议论文集、科技报告和学位论文等多种形式，其较好地描述了科学领域的发展、学科间的关系。随着现代信息技术的发展，文献著作数量迅速增加，引文网络已经形成了一个超大规模的复杂网络系统，并吸引了越来越多的关注。由于引文网络包含了多个领域的研究成果，代表了学术研究中重要的知识宝库，其已经成为研究的重要介质。
[0003]聚类分析又称群分析，它是研究(样品或指标)分类问题的一种统计分析方法，同时也是数据挖掘的一个重要算法。聚类(Cluster)分析是由若干模式(Pattern)组成的，通常，模式是一个度量(Measurement)的向量，或者是多维空间中的一个点。聚类分析以相似性为基础，在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。
[0004]基于文本的聚类算法的输入通常是将语料进行向量化，然后通过计算不同语料之间的相似度来作为文本与文本之间的相似度。传统的文献聚类算法通常将文献的摘要以及关键词等作为语料输入，这样的聚类算法得到的结果难以保证完整的引文网络结构。所以在可视化展示时，会导致不同簇之间的文献相互交叉引用，难以得到较好的可视化效果。

技术实现思路

[0005]有鉴于此，本专利技术旨在提出一种一种基于引文网络结构的关键词逆向传播算...

【技术保护点】

【技术特征摘要】
1.一种基于引文网络结构的关键词逆向传播算法，其特征在于：包括如下步骤：S1：建立弹簧电荷模型，并进行力导向布局处理，建立力导向布局图；S2：使用逆向传播算法，建立关键词传播模型，得到关键词权重变化对照曲线；S3：使用步骤S1中建立的力导向布局图，构建引文网络模型；S4：对力导向布局图进行迭代计算，直至力导向布局图中的能量状态到达最低值；S5：使用步骤S4中的迭代计算方式，代替步骤S3中建立的引文网络模型中的迭代计算方法，进行迭代计算；S6：在步骤S5中对引文网络进行迭代计算的同时，使用步骤S2得到的关键词权重变化对照曲线，调整引文网络模型中的关键词权重；S7：通过步骤S1至S6计算得到，收敛的引文网络布局图。2.根据权利要求1所述的一种基于引文网络结构的关键词逆向传播算法，其特征在于：步骤S1中建立力导向布局图的具体过程如下：S101：将弹簧电荷模型中每一个具有能量的放电粒子作为力导向布局中的一个节点；S102：根据粒子与粒子之间的库伦力以及胡克引力，计算得到两个粒子之间的相关作用力关联，将得到的相关作用力关联作为两个节点之间的连接关系，得到力导向布局中的边；S103：使用步骤S101和S102中得到的节点与边建立力导向布局图。3.根据权利要求1所述的一种基于引文网络结构的关键词逆向传播算法，其特征在于：步骤S2中建立关联词传播模型的过程如下：S201：建立神经网络模型，将关键词数据输入神经网络进行运算，计算每个神经元的输出，并生成最终的输出结果；S202：计算实际输出和目标输出之间的误差值，将误差值代入误差函...

【专利技术属性】
技术研发人员：邹文韬，
申请(专利权)人：紫光云技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人