当前位置: 首页 > 专利查询>清华大学专利>正文

基于难度采样元学习的地点推荐方法及装置制造方法及图纸

技术编号:27516552 阅读:33 留言:0更新日期:2021-03-02 18:50
本发明专利技术公开了一种基于难度采样元学习的地点推荐方法及装置,其中,该方法包括:根据不同城市的不同用户的交互数据生成训练数据和测试数据;构建推荐模型,利用训练数据和测试数据训练并优化推荐模型;利用元学习框架优化推荐模型的参数;通过推荐模型为用户进行城市推荐。该方法可以在数据稀疏的冷启动城市中取得更高的推荐性能。得更高的推荐性能。得更高的推荐性能。

【技术实现步骤摘要】
基于难度采样元学习的地点推荐方法及装置


[0001]本专利技术涉及智能推荐
,特别涉及一种基于难度采样元学习的地点推荐方法及装置。

技术介绍

[0002]下一个地点推荐(Next Point-Of-Interest Recommendation)技术是地图类应用产品(如谷歌地图、微软Bing地图、百度地图、Foursquare等)的重要技术,近年来受到学术界与工业界的广泛关注。应用这一技术,地图类产品可以依据用户当前所处的时空及其历史数据,为用户自动推荐下一个可能感兴趣的检索(或打卡)地点。这种智能推荐服务可以帮助用户提高检索效率、探寻周边地点,在提升用户体验与留存率上具有重要价值。
[0003]地点推荐与常见的商品推荐的本质区别在于,地点推荐问题与用户当前所处的时间空间环境高度相关。传统的地点推荐方法包括两类:一类基于统计机器学习方法,将矩阵分解、马尔科夫链等模型与地理信息融合进行推荐;另一类基于深度学习方法,利用图网络嵌入、循环神经网络等模型刻画用户与地点交互数据的时空关联。这些方法的主要缺陷在于:它们都依赖大量的训练数据。在本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于难度采样元学习的地点推荐方法,其特征在于,包括以下步骤:S1,根据不同城市的不同用户的交互数据生成训练数据和测试数据;S2,构建推荐模型,利用所述训练数据和所述测试数据训练并优化所述推荐模型;S3,利用元学习框架优化所述推荐模型的参数;S4,通过所述推荐模型为用户进行城市推荐。2.根据权利要求1所述的方法,其特征在于,所述训练数据和所述测试数据包括:每个用户根据时间顺序产生多个样本{(x
i
,y
i
)},定义最小历史数据数目m,用户历史数据总数目为n,则每个用户产生n-m个正样本:y
i
=1,其中,u是用户编号,为用户u的历史数据,r
i
为用户u的备选地点;利用均匀负采样,将正样本中的备选地点换成其他地点,构成负样本;将每个用户产生的正样本和负样本中,按照时间顺序将较早的k个样本作为训练数据,其余的样本为测试数据。3.根据权利要求1所述的方法,其特征在于,所述推荐模型包括:嵌入层、注意力层和全连接层;所述嵌入层用于将历史数据中的每一个地点、以及备选地点r
i
,利用多个相同的嵌入矩阵映射成一个向量;所述注意力层用于刻画备选地点与历史交互地点之间的关联,采用注意力机制,利用备选地点向量对每一个历史地点向量计算注意力分数并算加权和,得到所有历史地点的整体编码h:h=attention(e
candi
,e
hist
),attention(K,V)=softmax(MLP
att
([K;V;K-V;K
·
V]))V其中,MLP
att
是一个2层的多层感知机,其参数记为θ
att
,e
candi
代表备选地点向量,而e
hist
=[e1,e2,...,e
n
]是历史交互地点向量组成的列表,[;]表示向量拼接,
·
表示按位相乘;所述全连接层将所述历史地点的整体编码h与备选地点的编码向量e
candi
通过一个3层的全连接网络MLP
rec
,参数记为θ
rec
,映射成二分类标签,映射成二分类标签所述推荐模型的可训练参数为θ={E
cate
,E
time
,θ
att
,θ
rec
}。4.根据权利要求3所述的方法,其特征在于,所述嵌入矩阵包括地点编号的矩阵E
id
、地点类别的矩阵E
cate
、交互时间的矩阵E
time
,分别把地点编号、类别的独热向量、以及时间的小时编号三种离散变量映射到d维的向量,加上用户当前位置与交互地点的距离这一连续变量拼接起来,每一个地点都被映射成了一个(3d+1)维的向量。5.根据权利要求1所述的方法,其特征在于,所述利用元学习框架优化所述推荐模型的参数,包括:采样:在基本城市集合中均匀采样一组B
c
个城市,在每个城市中采样B
u
个用户,每个用户生成训练样本和测试样本,组成每个城市c在当前轮的训练数据和测试数据
内层更新:让当前轮的初始化参数θ在每一个城市的训练数据上分别做一步或多步梯度下降,得到该城市上的最佳参数度下降,得到该城市上的最佳参数其中,是二分类的交叉熵损失,α是内层更新的学习率;外层更新:利用各城市上的最佳参数在该城市的测试数据上计算内层更新后最佳参数的测试损失,并把这组城市的所有测试损失求和,再通过外层更新的优化器利用反向传播来更新初始化的参数θ:其中,β是外层更新的学习率,是当前采样的这组城市的集合。6.根据权利要求5所述的方法,其特征在于,所述利用元学习框架优化所述推荐模型,包括:S301,通过所述采样得到训练数据和测试数据,通过所述内层更新得到每个城市上各自的...

【专利技术属性】
技术研发人员:朱文武王鑫陈禹东
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1