本发明专利技术公开了一种基于蒙特卡洛方法和轻量化图神经网络的图书精排方法,涉及信息推荐领域,对用户节点执行初步分析,获取用户节点与第一图书候选集节点的第一图神经网络集;按照设定跳选取第一图神经网络集中的子图;分别针对子图中的用户节点及第一图书候选集节点中的每个执行至少两层带MC
【技术实现步骤摘要】
一种基于蒙特卡洛方法和轻量化图神经网络的图书精排方法
[0001]本专利技术涉及信息推荐领域,尤其涉及一种基于蒙特卡洛方法和轻量化图神经网络的图书精排方法。
技术介绍
[0002]推荐系统(Recommendation system)是一种在各类应用和电商场景下十分常用的技术。它的功能是根据用户的历史记录和一些物理特征,例如性别、年龄等,从海量的商品候选中挑选最有可能被用户消费的一小部分推荐给用户,从而节省用户的搜寻时间,提升用户的体验。通常情况下,推荐系统分为召回、粗排、精排步骤,这三部类似于三个漏斗,召回步骤从海量候选中粗略选出一批相对合适的候选,粗排再对结果精细化加工,筛选出一批更加契合用户的候选,最后再由精排细筛选得到推荐给用户的结果。
[0003]在图书管理系统中的推荐系统,用户比电商场景下的应用情况下相对较少,(通常在十万级以内),用户的消费行为相对稀疏(大多数用户的年消费次数在一百以内),推荐系统需要在见过更小的数据集的情况下,做出更有效的预测,从而给出更精准的推荐。
[0004]而现有的图书管理系统的推荐系统算法中,通常采用图神经网络(Graph neural network),来执行分析计算,而这种图神经网络是一种特殊的神经网络。该模型的输入出去一般的节点特征以外,还有节点与节点之间的邻接关系。因此,图神经网络能够有效建模节点之间的多跳关系信息,从而更好地分析图结构数据。在图书馆系统中,节点可以被分为用户节点和图书节点,用户节点之间可能存在同学关系、师生关系,图书节点之间可能存在同类型关系、同作者关系,用户与图书节点之间可能存在消费关系。而这些用户与图书节点之间的关系相对简单,采用现有的图神经网络来执行运算可能造成节点运算的复杂化,增加不必要的计算。
[0005]因此,针对上述问题,既要能兼顾需要在模型必然面对较大认知不确定性时的前提下,有效利用可量化的不确定性,对于模型进行改进,以提升模型在推荐系统中的表现。又能解决传统图神经网络又面临着模型计算量过大的问题,需要进行简化的问题。
[0006]因此,本领域的技术人员致力于开发一种新的图书精排方法。
技术实现思路
[0007]有鉴于现有技术的上述缺陷,本专利技术所要解决的是图书推荐系统中的精排推荐的简化计算过程并保持计算结果准确度的技术问题。
[0008]为实现上述目的,本专利技术提供了一种基于蒙特卡洛方法和轻量化图神经网络的图书精排方法,其特征在于,所述方法包括如下步骤:
[0009]对用户节点执行初步分析,获取所述用户节点与第一图书候选集节点的第一图神经网络集;按照设定跳选取所述第一图神经网络集中的子图;
[0010]分别针对所述子图中的用户节点及第一图书候选集节点中的每个执行至少两个带MC
‑
Dropout的神经网络的多次更新;
[0011]依据所述多次更新获取多个所述用户节点的图嵌入及所述第一图书候选集节点的图嵌入;
[0012]依据所述用户节点的图嵌入求取节点的第一不确定评估参数;
[0013]依据所述第一图书候选集节点的图嵌入求取节点的第二不确定评估参数;
[0014]依据所述第一不确定评估参数与所述第二不确定评估参数计算不确定性加权相似度值;
[0015]依据所述不确定性相似度值对所述第一图书候选集节点执行排序,获取对应所述用户节点的图书推荐。
[0016]进一步地,所述用户节点的图嵌入为:
[0017]对每次更新后的原始图嵌入求平均;
[0018]所述第一图书候选集节点的图嵌入为:对每次更新后的原始图嵌入求平均。
[0019]进一步地,
[0020]依据所述用户节点的图嵌入求取节点的第一不确定评估参数为:
[0021]对所述用户节点的图嵌入求方差;
[0022]依据所述第一图书候选集节点的图嵌入求取节点的第二不确定评估参数为:
[0023]对所述第一图书候选集节点的图嵌入求方差。
[0024]进一步地,
[0025]对所述图嵌入及所述不确定评估参数多轮聚合,之后执行计算不确定性加权相似度值:
[0026]计算
[0027][0028]重复K次,计算所述k为聚合轮次,所述K为聚合轮次总数,d
v
为v节点的度数,v节点为用户节点或第一图书候选集节点。
[0029]进一步地,
[0030]所述计算不确定性加权相似度值的计算方法为:s
ui
=(1+exp(
‑
c
u
‑
c
i
))cosine(e
u
,e
i
),其中cosine指余弦相似度,其中u为用户节点,i为图书节点。
[0031]进一步地,
[0032]所述第一图神经网络集生成中,所述用户节点与所述第一图书候选集节点使用相同的神经网络模型,或使用不同的神经网络模型。
[0033]进一步地,
[0034]所述带MC
‑
Dropout的神经网络包括多个随机的Dropout层。
[0035]进一步地,
[0036]所述依据所述不确定性相似度值对所述第一图书候选集节点执行排序步骤之前还包括:
[0037]针对所述多个随机的Dropout层计算不同的Dropout层输出结果之间的多个不确定性加权相似度值,选取不确定性加权相似度值。
[0038]进一步地,
[0039]所述k等于所述第一图神经网络集中的网络节点的层数。
[0040]进一步地,
[0041]所述第一不确定评估参数及所述第二不确定评估参数被存储。
[0042]技术效果
[0043]以下将结合附图对本专利技术的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本专利技术的目的、特征和效果。
[0044]通过在模型中引入Monte
‑
Carlo Dropout技术实现模型不确定性的建模。仅选取目标节点k跳内的子图进行计算。同时采用了先预测后聚合的模式。Monte
‑
Carlo Dropout会在预测阶段加入随机的Dropout层,使得模型在面对相同输入时会产生不同的输出,因此可以通过不同输出之间的差别建立评估参数来衡量模型不确定性,并且对这种不确定性的评估参数能够执行量化排序。
[0045]图神经网络的聚合模块的每一次聚合步骤仅考虑目标节点的邻居节点,因此对于一个k层的图神经网络仅需考虑目标节点的k跳内的节点即可。而对于精排模型而言,由于召回和粗排已经筛除了大量节点,对于少量的候选节点而言,仅采用k跳子图可以极大缩减计算成本。同时先预测后聚合的模式使得预测模块的结果可以预存,不必重复计算,从而进一步降低了计算开支。
[0046]通过多次输出结果的方差可以有效建模模型的不确定性。在不影响计算结果准确度的情况下,有效减少了计算开销。
本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于蒙特卡洛方法和轻量化图神经网络的图书精排方法,其特征在于,所述方法包括如下步骤:。对用户节点执行初步分析,获取所述用户节点与第一图书候选集节点的第一图神经网络集;按照设定跳选取所述第一图神经网络集中的子图;分别针对所述子图中的用户节点及第一图书候选集节点中的每个执行至少两个带MC
‑
Dropout的神经网络的多次更新;依据所述多次更新获取多个所述用户节点的图嵌入及所述第一图书候选集节点的图嵌入;依据所述用户节点的图嵌入求取节点的第一不确定评估参数;依据所述第一图书候选集节点的图嵌入求取节点的第二不确定评估参数;依据所述第一不确定评估参数与所述第二不确定评估参数计算不确定性加权相似度值;依据所述不确定性相似度值对所述第一图书候选集节点执行排序,获取对应所述用户节点的图书推荐。2.如权利要求1所述的基于蒙特卡洛方法和轻量化图神经网络的图书精排方法,其特征在于,所述用户节点的图嵌入为:对每次更新后的原始图嵌入求平均;所述第一图书候选集节点的图嵌入为:对每次更新后的原始图嵌入求平均。3.如权利要求1所述的基于蒙特卡洛方法和轻量化图神经网络的图书精排方法,其特征在于,依据所述用户节点的图嵌入求取节点的第一不确定评估参数为:对所述用户节点的图嵌入求方差;依据所述第一图书候选集节点的图嵌入求取节点的第二不确定评估参数为:对所述第一图书候选集节点的图嵌入求方差。4.如权利要求1所述的基于蒙特卡洛方法和轻量化图神经网络的图书精排方法,其特征在于,对所述图嵌入及所述不确定评估参数多轮聚合,之后执行计算不确定性加权相似度值:计算重复K次,计算所述k为聚合轮次,所述K为聚合轮次总数,d
v
为v节点的度数,v节点为统称的用...
【专利技术属性】
技术研发人员:宋涛,郑承宇,管海兵,李新碗,徐伟国,
申请(专利权)人:江苏嘉图网络科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。