基于相似度计算的档案推荐方法技术

技术编号：39717355 阅读：31 留言：0更新日期：2023-12-17 23:24

本发明专利技术涉及档案管理技术领域，公开了一种基于相似度计算的档案推荐方法，其中方法包括：

全部详细技术资料下载

【技术实现步骤摘要】
基于相似度计算的档案推荐方法

[0001]本专利技术涉及档案管理
，具体涉及一种基于相似度计算的档案推荐方法
。

技术介绍

[0002]随着人工智能迅猛发展，智能检索得以应用于档案管理方面，由此研发的档案管理系统己经在档案的管理工作中得到了广泛应用，相比传统的纸质档案管理方式具有遮罩速度块
、
管理流程简单等优点
。
[0003]目前针对档案管理研发的管理系统数量较少，且档案管理信息系统功能单一，更新速度缓慢，但是随着现代科技的进步，记录档案的设备与方式逐渐增多，档案的类型也包含多种类型的文件，如
Word
文档
、PDF
文档
、
图片资料
、
音频
、
视频资料等，各类型文件在保存
、
归档与编研方面又与传统文档存在各种差异，因此如何能够有效管理各类型文件资源，是现代档案管理系统更新改进所必须要考虑的问题
。
[0004]现有技术中，已有人提出能满足上述大部分需求的...

【技术保护点】

【技术特征摘要】
1.
一种基于相似度计算的档案推荐方法，其特征在于，包括如下步骤：
S1
：采集不同用户的历史搜索数据以及评价反馈信息，分别计算得出不同用户之间搜索数据的相似度，以及同一用户不同搜索数据之间的相似度；
S2
：对所述
S1
中的两种相似度进行相似性近邻选择，从而获得用户的相似最近数据集以及搜索数据的相似最近数据集；
S3
：对所述用户的相似最近数据集和所述搜索数据的相似最近数据集进行评价，获得评价预测值；
S4
：根据所述评价预测值对用户进行档案推荐
。2.
根据权利要求1所述的基于相似度计算的档案推荐方法，其特征在于，在所述
S1
中，计算同一用户不同搜索数据之间的相似度的数学公式为：其中，
sim(i
，
j)
表示在第
i
条搜索数据和第
j
条搜索数据之间的搜索数相似度，第
u
个用户对搜索数据
i
和搜索数据
j
的评价反馈信息分别表示为
R
u
，
i
和
R
u
，
j
，和表示一起使用数据
i
和数据
j
的用户的平均反馈信息，
U
ij
表示所有使用过数据
i
和数据
j
的用户集合
。3.
根据权利要求2所述的基于相似度计算的档案推荐方法，其特征在于，在所述
S1
中，计算不同用户之间搜索数据相似度的数学公式为：其中，
sim(u
a
，
u
b
)
表示第
u
a
个用户和第
u
b
个用户针对第
i
条搜索数据的相似度，第
i
条搜索数据在第
u
a
个用户和第
u
b
个用户处的反馈信息分别是个用户处的反馈信息分别是是第
u
a
个用户搜索过的所有文件的平均反馈信息，是第
u
b
个用户搜索过的所有文件的平均反馈信息，
U
i
是使用过
i
数据的用户集合
。4.
根据权利要求1所述的基于相似度计算的档案推荐方法，其特征在于，在所述
S2
中，对所述两种相似度进行近邻选择的具体步骤如下：
S21
：从所述
S1
中的得出的两种相似度中筛选出小于
0.5
的相邻数据，并从所述两种相似度中选择大于
0.5
的相邻数据作为最近数据；
S22
：根据所述最近数据计算用户
u
a
的相似...

【专利技术属性】
技术研发人员：王艳华，梁入文，
申请(专利权)人：烟台职业学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人