一种期刊异常检测方法、设备及存储介质技术

技术编号:41510323 阅读:30 留言:0更新日期:2024-05-30 14:49
本发明专利技术公开了一种期刊异常检测方法、设备及存储介质,方法包括步骤:收集正常期刊和异常期刊数据,得到数据集;对数据集进行第一处理,得到第一处理后的数据;对第一预处理后的数据进行第二处理,得到第二处理后的数据,将第二处理后的数据划分为训练集和测试集;所述第二处理采用多种采样技术的结合;构建复合式自编码器模型,并且在其中引入注意力层;采用自适应正则化方法和训练集对自编码器模型进行深度训练,得到训练完成的模型;运用测试集及AUC‑PRC指标进行训练完成的模型的性能评估;本发明专利技术在在分类异常期刊方面能有效地学习数据的深层特征、执行降维和去噪操作,同时具有出色的泛化能力。

【技术实现步骤摘要】

本专利技术涉及期刊质量监测领域,尤其涉及一种期刊异常检测方法、设备及存储介质


技术介绍

1、在当前的学术出版领域,文献引用通常被视为衡量学术影响力的关键指标。然而,过度自引的现象已成为一种扭曲学术贡献真实性的行为,这不仅损害了研究人员和期刊的声誉,还可能对整个学术领域的健康发展产生负面影响。尽管当前已有多种检测论文不端行为的方法,但针对期刊异常的检测研究相对较少。更为严峻的是,现有研究通常依赖于较小的数据集,这可能导致过拟合,从而无法真正学习到如何有效检测异常行为。


技术实现思路

1、为了解决目前的期刊异常检测中存在的过拟合及检测精度不高的技术问题,本专利技术提出了一种基于自编码器的方法,用于异常期刊的分类和检测。本专利技术的方法不仅在正常和异常期刊之间进行分类,而且能够识别整个数据集中的异常点。通过迁移学习,将自编码器从其在风控数据异常检测中的成功应用迁移到期刊异常检测领域。特别地,自编码器有效地学习了正常期刊的特征,识别出深层次和非线性的特征关系,这对于区分正常和异常期刊至关重要。</p>

2、具体本文档来自技高网...

【技术保护点】

1.一种期刊异常检测方法,其特征在于:包括以下步骤:

2.如权利要求1所述的一种期刊异常检测方法,其特征在于:步骤S2中,所述第一处理包括:特征选择和特征标准化。

3.如权利要求2所述的一种期刊异常检测方法,其特征在于:所述特征选择,选择得到的特征包括:自引率、近两年自引率和近三年自引率。

4.如权利要求2所述的一种期刊异常检测方法,其特征在于:所述特征标准化,指对特征进行归一化处理。

5.如权利要求1所述的一种期刊异常检测方法,其特征在于:步骤S3中,所述第二处理,首先采用DBSCAN聚类技术剔除噪声样本,随后采用TomekLinks进行...

【技术特征摘要】

1.一种期刊异常检测方法,其特征在于:包括以下步骤:

2.如权利要求1所述的一种期刊异常检测方法,其特征在于:步骤s2中,所述第一处理包括:特征选择和特征标准化。

3.如权利要求2所述的一种期刊异常检测方法,其特征在于:所述特征选择,选择得到的特征包括:自引率、近两年自引率和近三年自引率。

4.如权利要求2所述的一种期刊异常检测方法,其特征在于:所述特征标准化,指对特征进行归一化处理。

5.如权利要求1所述的一种期刊异常检测方法,其特征在于:步骤s3中,所述第二处理,首先采用dbsca...

【专利技术属性】
技术研发人员:龙景倩李振华李浩
申请(专利权)人:中国地质大学武汉
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1