一种基于逻辑回归的文献推荐系统的排序方法技术方案

技术编号:36693768 阅读:29 留言:0更新日期:2023-02-27 20:03
本发明专利技术公开了一种基于逻辑回归的文献推荐系统的排序方法,包括分析推荐应用场景,确立学习目标;分析用户日志分布,试验并确定采样方案;获取特征数据,构建特征数据集合;分析文献侧、机构侧、作者侧以及交互特征,进行特征筛选;将文献推荐作为分类问题,采用逻辑回归模型训练;划分同等流量,将训练好的模型进行线上评估。本发明专利技术能够利用文献、用户、上下文等多种不同特征,通过预测正样本的概率对文献进行个性化排序;具有可解释性强和数学含义支撑,效果显著并且训练和工程开销小等优点,是一种投入小、见效快的方案。见效快的方案。见效快的方案。

【技术实现步骤摘要】
一种基于逻辑回归的文献推荐系统的排序方法


[0001]本专利技术涉及个性化推荐
,尤其涉及一种基于逻辑回归的文献推荐系统的排序方法。

技术介绍

[0002]从知识服务平台上阅读、下载文献是各大学术研究人员获取知识的重要途径。知识服务平台上有海量的文献,这些数据具有丰富的发掘价值和预测潜力;但面对大量的文献,用户筛选出匹配的信息所花费的成本更高了。应用数据挖掘技术发掘文献特征和用户兴趣特点,使用机器学习技术推荐文献,能快速从纷繁复杂的文献中获取有效的信息,让用户在搜索和分类结果之外发现更感兴趣、更个性化的文献补充。通过系统引导用户发现信息,让用户发现一些新颖和令人惊喜的内容;靠知识内容留人,提升用户粘性;合理利用流量,提升平台收益。
[0003]现有知识服务平台上的文献推荐打分策略,特征简单,过于依靠人工策略,缺少数学依据。而深度学习模型虽然在较多领域效果显著,但需新增过多的工程设计和代码,才能上线部署,还会增加较多线上延时,无法迅速迭代。逻辑回归模型结构简单,采用梯度下降的方式寻求最优解,效果显著并且训练和工程开销小。
专本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于逻辑回归的文献推荐系统的排序方法,其特征在于,包括以下步骤:步骤A分析推荐应用场景,确立学习目标;步骤B分析用户日志分布,试验并确定采样方案;步骤C获取特征数据,构建特征数据集合;步骤D分析文献侧、机构侧、作者侧以及交互特征,进行特征筛选;步骤E将文献推荐作为分类问题,采用逻辑回归模型训练;步骤F划分同等流量,将训练好的模型进行线上评估。2.如权利要求1所述的基于逻辑回归的文献推荐系统的排序方法,其特征在于,所述步骤B包括:获取用户行为日志并清洗,分析样本数据分布;在采样获取训练样本时,采用有点击行为用户的相关数据,包括所有曝光文献数据和用户行为日志。3.如权利要求1所述的基于逻辑回归的文献推荐系统的排序方法,其特征在于,所述步骤C中特征数据包括文献侧、机构侧、作者侧及用户数据;其中,文献侧包含文献发表时间、下载量、被引量、相关度、影响因子;机构侧包含机构专业领域、发文量、下载量、被引量、项目数量、科研人员数量;作者侧包含作者发文总量、核心期刊发文量、被引量、H指数、G指数;用户数据信息包含兴趣爱好以及操作文献、操作时间;构建特征数据集合是指对文献、机构、作者、用户基本信息建模得到单边特征,对用户行为日志建模得到双边特征。4.如权利要求3所述的基于逻辑回归的文献推荐系统的排序方法,其特征在于,获取特征数据的步骤包括:C1获取文献侧特征;C2获取学者侧和机构侧特征;C3基于多个时间窗口构建用户和文献交互类特征。5.如权利要求2所述的基于逻辑回归的文献推荐系统的排序方法,其特征在于,所述C1中:文献侧特征包含基础特征、统计特征和类别特征,其中,文献基础特征包含发表时间、下载量、被引量、相关度、影响因子;统计特征包含一段时间内推荐侧的浏览率、下载率、收藏率;类别特征包含文献类型、行业类型、学科类型。6.如权利要求2所述的基于逻辑回归的文献推荐系统的排序方法,其特征在于,所述C2中:通过将文献的第一作者与学者库中的相应字段关联,获取学者侧多个特征,学者侧特征包含发文总量、核心期刊论文数、被引量、作者指数;通过将文献所属的机构和学科类型,与机构侧中的相应字段关联,获取机构侧各专业领域的多个特征;机构侧特征包含各专业领域发文量、下载量被引量、项目数量、科研人员数量。7.如权利要求1所述的基于逻辑回归的文献推荐系统的排序方法,其特征在于,所述D包括:对收集到的三类特征数据进行预处理,包括去除异常值、去除远离数据分布的噪声数据;所述三类特征数据包括文献侧特征数据、机构侧特征数据和作者侧特征数据;对于连续性特征,计算特征向量与正负样本标签向量之间的皮尔逊相关参数,分析特
征与拟合目标之间的相关性。8.如权利要求6所述的基于逻辑回归的文...

【专利技术属性】
技术研发人员:张良江程肖银涛
申请(专利权)人:同方知网数字出版技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1