当前位置: 首页 > 专利查询>宿州学院专利>正文

一种移动时空感知下动态即时推荐服务模型建立方法技术

技术编号:17007833 阅读:27 留言:0更新日期:2018-01-11 04:04
本发明专利技术公开了一种移动时空感知下动态即时推荐服务模型建立方法。该方法包括:对所采集的移动用户情景日志数据集进行预处理;采用CIT‑LDA主题模型,抽取每个时间片下的移动时空感知信息和用户行为偏好变化信息进行语义建模;采用对称KL散度计算用户兴趣主题的漂移概率,确定用户兴趣变化点;将用户兴趣子主题漂移轨迹的演化分为三种类型;根据用户的长期兴趣、短期兴趣以及每个兴趣所具有的权重,确定用户行为偏好模型;确定基于Top‑K的个性化动态即时推荐服务模型。本发明专利技术在Hadoop并行分布式计算环境下,使用CIT‑LDA主题模型、构建用户行为偏好变化的模型和基于Top‑K的个性化推荐方法对移动互联下基于情景感知和用户兴趣变化的个性化推荐服务进行探索性研究。

【技术实现步骤摘要】
一种移动时空感知下动态即时推荐服务模型建立方法
本专利技术涉及移动互联网领域,更具体的涉及一种移动时空感知下动态即时推荐服务模型建立方法。
技术介绍
随着移动互联网爆炸式增长、电子商务的迅猛发展以及智能手机的快速普及,尤其是基于位置的社交网络的盛行和O2O商业模式的出现,使“移动互联新生态”在全球范围内迅速成长,极大地加快了移动信息产业向社会经济各个层面、大众日常生活的渗透。与传统PC互联网相比,移动互联网最大的区别在于“移动”二字,而“移动”所提供的信息服务,又因为人的移动而渗透到现实世界,与真实的社会形成了更强互动,基于移动设备的应用和服务己经成为用户信息获取、休闲娱乐的主要方式。与此同时,这些移动应用和服务也产生了海量的历史数据,为深入探索移动互联环境下的潜在价值、开发全新的移动应用和服务提供了充分的机遇。但是,如何从浩瀚的移动网络环境中发现用户真正感兴趣的信息资源,丰富并满足移动用户对信息的个性化需求,逐渐成为移动互联网中个性化服务领域亟待解决的技术难题。目前,对移动环境下的个性化推荐问题虽有一定程度的研究,但是,由于在移动时空情景下,用户的行为偏好会经常随时间发生变化,另外,移动会带来时空情景的切换,不同情景信息会对用户需求产生不同的影响,而传统推荐算法大都采用静态的研究方法,忽略了用户评分项目的时间因素,没有考虑移动时空下用户行为偏好变化的问题,并且针对移动推荐过程中情景信息考虑不足,以及没有充分考虑用户行为偏好变化,从而不能准确、迅速地从海量的移动应用和服务中找到用户感兴趣的内容实现个性化推荐服务。综上所述,现有技术中,存在针对移动推荐过程中情景信息考虑不足,以及没有充分考虑用户行为偏好变化,不能准确、迅速地从海量的移动应用和服务中找到用户感兴趣的内容实现个性化推荐服务的问题。
技术实现思路
本专利技术实施例提供一种移动时空感知下动态即时推荐服务模型建立方法,用以解决现有技术中存在针对移动推荐过程中情景信息考虑不足,以及没有充分考虑用户行为偏好变化,不能准确、迅速地从海量的移动应用和服务中找到用户感兴趣的内容实现个性化推荐服务的问题。本专利技术实施例提供一种移动时空感知下动态即时推荐服务模型建立方法,包括:采集移动用户情景日志数据集,搭建Hadoop并行分布式处理环境,对所采集的移动用户情景日志数据集进行预处理,并根据预先设定的HDFS中每个数据块大小对移动用户情景日志数据集进行分割;使用每个Map处理一个划分好的数据块,在每一个Map下,按照等时段划分预处理好的移动用户情景日志数据集,进行键值对映射,采用CIT-LDA主题模型,抽取每个时间片下的移动时空感知信息和用户行为偏好变化信息进行语义建模;通过Shuffle对键值对执行排序,并合并具有相同主题键的多个记录;通过Reduce对键值对执行最后一次合并操作;采用对称KL散度计算用户兴趣主题的漂移概率,确定用户兴趣变化点;根据用户兴趣子主题与前向关联子主题和后向关联子主题间的关系,将用户兴趣子主题漂移轨迹的演化分为新兴趣产生、兴趣保持和兴趣消失三种类型;当用户行为偏好发生变化时,分析所对应的用户兴趣变化点,挖掘用户所具有的长期兴趣和短期兴趣;计算用户行为偏好在整个生命周期中绝对强度和相对强度,构建用户行为偏好变化轨迹的强度走势,挖掘每个兴趣所具有的权重;根据用户的长期兴趣、短期兴趣以及每个兴趣所具有的权重,确定用户行为偏好变化模型;根据用户行为偏好变化模型,结合移动时空感知信息,确定基于Top-K的个性化动态即时推荐服务模型。较佳地,所述对所采集的移动用户情景日志数据集进行预处理,包括:对所采集到的移动用户情景日志数据集使用汉语分词器ICTCLAS进行分词,将切分出的词进行停用词过滤形成关键词集合;为保证所抽取关键词的质量,对每个关键词计算TF-IDF值,保留大于给定阈值的关键词,使用统一向量表示所采集的移动用户情景日志文件,形成训练语料库。较佳地,所述CIT-LDA主题模型,包括:用户u在时刻t选择服务v的概率,通过下式确定:P(v|θ,β,u,t,θ′,C,λ)=λP(v|θ,β,u,t)+(1-λ)P(v|θ′,C,t)其中,P(v|θ,β,u,t)表示用户u根据自身在时刻t的兴趣分布θ和主题分布β选择服务v的概率;P(v|θ′,C,t)表示服务v被时刻t的移动情景C和移动情景分布θ′生成的概率,t表示当前时间片;参数λ为CIT-LDA模型的混合权重,表示用户自身行为偏好影响的概率,1-λ表示用户受当时移动时空情景影响的概率;对于当前时间片t,以时间片t-1中子主题分布和服务分布的加权作为时间片t中相应分布的先验;时间片t中用户兴趣子主题分布和服务分布的Dirichlet先验满足下式:φt=φt-1w其中,φt中的每一列对应时间片t-1中的一个兴趣子主题-服务分布,w为权重矩阵。较佳地,所述采用对称KL散度计算用户兴趣主题的漂移概率,判断用户兴趣变化点,包括:用户兴趣通过使用移动用户情景日志中特征词汇的出现概率表示,判断不同时期用户兴趣主题间的语义相似性对应于度量两个概率分布间的近似程度;令滑动窗口包含N个时间片,把时间片t中的用户所具有的兴趣j记作原KL散度是不对称的,但不同时期用户兴趣主题间的语义相似性是对称的,即对于任意用户兴趣主题和和的相似性与和的相似性相等,改进原KL散度,确定基于对称KL散度的用户兴趣子主题相似度为:其中,p(w)和q(w)分别表示特征词汇w在用户兴趣子主题和中的出现概率,V代表一个词汇字典的集合。较佳地,所述前向关联用户兴趣子主题为:滑窗内各时间片i(i=t-N,…,t-1)中与相似度最大的用户兴趣子主题,记作所述后向关联用户兴趣子主题为:滑窗内各时间片i(i=t+1,…,t+N)中与相似度最大的用户兴趣子主题,记作较佳地,所述新兴趣产生,包括:对于用户兴趣子主题若不存在前向关联兴趣子主题使得和的相似度大于阈值ε,既不满足则是在时间片t中产生的新兴趣主题;所述兴趣保持,包括:对于用户兴趣子主题若存在前向关联兴趣子主题使得和的相似度大于阈值ε,既并且也是的后向关联兴趣子主题,即则是的后继,用户的兴趣没有发生太大变化;所述兴趣消失,包括:对于用户兴趣子主题若不存在后向关联子主题使得和的相似度大于阈值ε,既不满足则主题在时间片t中消亡,用户已不再具有此兴趣。较佳地,所述绝对强度包括:设di={di1…diM}表示移动用户情景日志di的单词序列,M表示用户情景日志di所包含的单词个数,i表示用户情景日志di所表达的用户兴趣主题;用户兴趣主题i在时间t的绝对强度采用如下公式:所述相对强度包括:用户兴趣主题i在时间t的相对强度采用如下公式:其中,t′为t-N与t-1之间的任一时间片,K为用户兴趣主题的个数,p为用户兴趣主题K中的其中任意一个主题。较佳地,所述基于Top-K的个性化动态即时推荐服务模型,包括:根据用户行为偏好变化模型,建立移动用户评分的情景模型;设推荐系统中的移动时空情景信息C=(C1,C2),其中,C1表示时间情景,C2表示空间情景;设用户兴趣信息有m种,表示为I=(I1,I2,…Im);以向量形式化描述项目评分的情景模型为:ItemScoreCI=(Item,C1,C2,I1,I2,…Im)其中,本文档来自技高网
...
一种移动时空感知下动态即时推荐服务模型建立方法

【技术保护点】
一种移动时空感知下动态即时推荐服务模型建立方法,其特征在于,包括:采集移动用户情景日志数据集,搭建Hadoop并行分布式处理环境,对所采集的移动用户情景日志数据集进行预处理,并根据预先设定的HDFS中每个数据块大小对移动用户情景日志数据集进行分割;使用每个Map处理一个划分好的数据块,在每一个Map下,按照等时段划分预处理好的移动用户情景日志数据集,进行键值对映射,采用CIT‑LDA主题模型,抽取每个时间片下的移动时空感知信息和用户行为偏好变化信息进行语义建模;通过Shuffle对键值对执行排序,并合并具有相同主题键的多个记录;通过Reduce对键值对执行最后一次合并操作;采用对称KL散度计算用户兴趣主题的漂移概率,确定用户兴趣变化点;根据用户兴趣子主题与前向关联子主题和后向关联子主题间的关系,将用户兴趣子主题漂移轨迹的演化分为新兴趣产生、兴趣保持和兴趣消失三种类型;当用户行为偏好发生变化时,分析所对应的用户兴趣变化点,挖掘用户所具有的长期兴趣和短期兴趣;计算用户行为偏好在整个生命周期中绝对强度和相对强度,构建用户行为偏好变化轨迹的强度走势,挖掘每个兴趣所具有的权重;根据用户的长期兴趣、短期兴趣以及每个兴趣所具有的权重,确定用户行为偏好变化模型;根据用户行为偏好变化模型,结合移动时空感知信息,确定基于Top‑K的个性化动态即时推荐服务模型。...

【技术特征摘要】
1.一种移动时空感知下动态即时推荐服务模型建立方法,其特征在于,包括:采集移动用户情景日志数据集,搭建Hadoop并行分布式处理环境,对所采集的移动用户情景日志数据集进行预处理,并根据预先设定的HDFS中每个数据块大小对移动用户情景日志数据集进行分割;使用每个Map处理一个划分好的数据块,在每一个Map下,按照等时段划分预处理好的移动用户情景日志数据集,进行键值对映射,采用CIT-LDA主题模型,抽取每个时间片下的移动时空感知信息和用户行为偏好变化信息进行语义建模;通过Shuffle对键值对执行排序,并合并具有相同主题键的多个记录;通过Reduce对键值对执行最后一次合并操作;采用对称KL散度计算用户兴趣主题的漂移概率,确定用户兴趣变化点;根据用户兴趣子主题与前向关联子主题和后向关联子主题间的关系,将用户兴趣子主题漂移轨迹的演化分为新兴趣产生、兴趣保持和兴趣消失三种类型;当用户行为偏好发生变化时,分析所对应的用户兴趣变化点,挖掘用户所具有的长期兴趣和短期兴趣;计算用户行为偏好在整个生命周期中绝对强度和相对强度,构建用户行为偏好变化轨迹的强度走势,挖掘每个兴趣所具有的权重;根据用户的长期兴趣、短期兴趣以及每个兴趣所具有的权重,确定用户行为偏好变化模型;根据用户行为偏好变化模型,结合移动时空感知信息,确定基于Top-K的个性化动态即时推荐服务模型。2.如权利要求1所述的移动时空感知下动态即时推荐服务模型建立方法,其特征在于,所述对所采集的移动用户情景日志数据集进行预处理,包括:对所采集到的移动用户情景日志数据集使用汉语分词器ICTCLAS进行分词,将切分出的词进行停用词过滤形成关键词集合;为保证所抽取关键词的质量,对每个关键词计算TF-IDF值,保留大于给定阈值的关键词,使用统一向量表示所采集的移动用户情景日志文件,形成训练语料库。3.如权利要求1所述的移动时空感知下动态即时推荐服务模型建立方法,其特征在于,所述CIT-LDA主题模型,包括:用户u在时刻t选择服务v的概率,通过下式确定:P(v|θ,β,u,t,θ′,C,λ)=λP(v|θ,β,u,t)+(1-λ)P(v|θ′,C,t)其中,P(v|θ,β,u,t)表示用户u根据自身在时刻t的兴趣分布θ和主题分布β选择服务v的概率;P(v|θ′,C,t)表示服务v被时刻t的移动情景C和移动情景分布θ′生成的概率,t表示当前时间片;参数λ为CIT-LDA模型的混合权重,表示用户自身行为偏好影响的概率,1-λ表示用户受当时移动时空情景影响的概率;对于当前时间片t,以时间片t-1中子主题分布和服务分布的加权作为时间片t中相应分布的先验;时间片t中用户兴趣子主题分布和服务分布的Dirichlet先验满足下式:φt=φt-1w其中,φt中的每一列对应时间片t-1中的一个兴趣子主题-服务分布,w为权重矩阵。4.如权利要求1所述的移动时空感知下动态即时推荐服务模型建立方法,其特征在于,所述采用对称KL散度计算用户兴趣主题的漂移概率,判断用户兴趣变化点,包括:用户兴趣通过使用移动用户情景日志中特征词汇的出现概率表示,判断不同时期用户兴趣主题间的语义相似性对应于度量两个概率分布间的近似程度;令滑动窗口包含N个时间片,把时间片t中的用户所具有的兴趣j记作原KL散度是不对称的,但不同时期用户兴趣主题间的语义相似性是对称的,即对于任意用户兴趣主题和Tlm,和Tlm的相似性与Tlm和的相似性相等,改进原KL散度,确定基于对称KL散度的用户兴趣子主题相似度为:其中,p(w)和q(w)分别表示特征词汇w在用户兴趣子主题和Tlm中的出现概率,V代表一个词汇字典的集合。5.如权利要求4所述的移动时空感知下动态即时推荐服务模型建立方法,其特征在于,所述前向关联用户兴趣子主题为:滑窗内各时间片i(i=t-N,…,t-1)中与相似度最大的用户兴趣子主题,记作所述后向关联用户兴趣子主题为:滑窗内各时间片i(i=t+1,…,t+N)中与相似度最大的用户兴趣子主题,记作6.如权利要求5所述的移动时空感知下动态即时推荐服务模型建立方法,其特征在于,所述新兴趣产生,包括:对于用户兴趣子主...

【专利技术属性】
技术研发人员:崔琳汪材印张志伟宋启祥吴孝银李玉林戚溪溪
申请(专利权)人:宿州学院
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1