一种移动时空感知下动态即时推荐服务模型建立方法技术

技术编号：17007833 阅读：27 留言：0更新日期：2018-01-11 04:04

本发明专利技术公开了一种移动时空感知下动态即时推荐服务模型建立方法。该方法包括：对所采集的移动用户情景日志数据集进行预处理；采用CIT‑LDA主题模型，抽取每个时间片下的移动时空感知信息和用户行为偏好变化信息进行语义建模；采用对称KL散度计算用户兴趣主题的漂移概率，确定用户兴趣变化点；将用户兴趣子主题漂移轨迹的演化分为三种类型；根据用户的长期兴趣、短期兴趣以及每个兴趣所具有的权重，确定用户行为偏好模型；确定基于Top‑K的个性化动态即时推荐服务模型。本发明专利技术在Hadoop并行分布式计算环境下，使用CIT‑LDA主题模型、构建用户行为偏好变化的模型和基于Top‑K的个性化推荐方法对移动互联下基于情景感知和用户兴趣变化的个性化推荐服务进行探索性研究。

全部详细技术资料下载

【技术实现步骤摘要】
一种移动时空感知下动态即时推荐服务模型建立方法
本专利技术涉及移动互联网领域，更具体的涉及一种移动时空感知下动态即时推荐服务模型建立方法。
技术介绍
随着移动互联网爆炸式增长、电子商务的迅猛发展以及智能手机的快速普及，尤其是基于位置的社交网络的盛行和O2O商业模式的出现，使“移动互联新生态”在全球范围内迅速成长，极大地加快了移动信息产业向社会经济各个层面、大众日常生活的渗透。与传统PC互联网相比，移动互联网最大的区别在于“移动”二字，而“移动”所提供的信息服务，又因为人的移动而渗透到现实世界，与真实的社会形成了更强互动，基于移动设备的应用和服务己经成为用户信息获取、休闲娱乐的主要方式。与此同时，这些移动应用和服务也产生了海量的历史数据，为深入探索移动互联环境下的潜在价值、开发全新的移动应用和服务提供了充分的机遇。但是，如何从浩瀚的移动网络环境中发现用户真正感兴趣的信息资源，丰富并满足移动用户对信息的个性化需求，逐渐成为移动互联网中个性化服务领域亟待解决的技术难题。目前，对移动环境下的个性化推荐问题虽有一定程度的研究，但是，由于在移动时空情景下，用户的行为偏好会经常随时间发生变化，另外，移动会带来时空情景的切换，不同情景信息会对用户需求产生不同的影响，而传统推荐算法大都采用静态的研究方法，忽略了用户评分项目的时间因素，没有考虑移动时空下用户行为偏好变化的问题，并且针对移动推荐过程中情景信息考虑不足，以及没有充分考虑用户行为偏好变化，从而不能准确、迅速地从海量的移动应用和服务中找到用户感兴趣的内容实现个性化推荐服务。综上所述，现有技术中，存在针对移动推荐过程中...
一种移动时空感知下动态即时推荐服务模型建立方法

【技术保护点】
一种移动时空感知下动态即时推荐服务模型建立方法，其特征在于，包括：采集移动用户情景日志数据集，搭建Hadoop并行分布式处理环境，对所采集的移动用户情景日志数据集进行预处理，并根据预先设定的HDFS中每个数据块大小对移动用户情景日志数据集进行分割；使用每个Map处理一个划分好的数据块，在每一个Map下，按照等时段划分预处理好的移动用户情景日志数据集，进行键值对映射，采用CIT‑LDA主题模型，抽取每个时间片下的移动时空感知信息和用户行为偏好变化信息进行语义建模；通过Shuffle对键值对执行排序，并合并具有相同主题键的多个记录；通过Reduce对键值对执行最后一次合并操作；采用对称KL散度计算用户兴趣主题的漂移概率，确定用户兴趣变化点；根据用户兴趣子主题与前向关联子主题和后向关联子主题间的关系，将用户兴趣子主题漂移轨迹的演化分为新兴趣产生、兴趣保持和兴趣消失三种类型；当用户行为偏好发生变化时，分析所对应的用户兴趣变化点，挖掘用户所具有的长期兴趣和短期兴趣；计算用户行为偏好在整个生命周期中绝对强度和相对强度，构建用户行为偏好变化轨迹的强度走势，挖掘每个兴趣所具有的权重；根据用户的长期兴趣...

【技术特征摘要】
1.一种移动时空感知下动态即时推荐服务模型建立方法，其特征在于，包括：采集移动用户情景日志数据集，搭建Hadoop并行分布式处理环境，对所采集的移动用户情景日志数据集进行预处理，并根据预先设定的HDFS中每个数据块大小对移动用户情景日志数据集进行分割；使用每个Map处理一个划分好的数据块，在每一个Map下，按照等时段划分预处理好的移动用户情景日志数据集，进行键值对映射，采用CIT-LDA主题模型，抽取每个时间片下的移动时空感知信息和用户行为偏好变化信息进行语义建模；通过Shuffle对键值对执行排序，并合并具有相同主题键的多个记录；通过Reduce对键值对执行最后一次合并操作；采用对称KL散度计算用户兴趣主题的漂移概率，确定用户兴趣变化点；根据用户兴趣子主题与前向关联子主题和后向关联子主题间的关系，将用户兴趣子主题漂移轨迹的演化分为新兴趣产生、兴趣保持和兴趣消失三种类型；当用户行为偏好发生变化时，分析所对应的用户兴趣变化点，挖掘用户所具有的长期兴趣和短期兴趣；计算用户行为偏好在整个生命周期中绝对强度和相对强度，构建用户行为偏好变化轨迹的强度走势，挖掘每个兴趣所具有的权重；根据用户的长期兴趣、短期兴趣以及每个兴趣所具有的权重，确定用户行为偏好变化模型；根据用户行为偏好变化模型，结合移动时空感知信息，确定基于Top-K的个性化动态即时推荐服务模型。2.如权利要求1所述的移动时空感知下动态即时推荐服务模型建立方法，其特征在于，所述对所采集的移动用户情景日志数据集进行预处理，包括：对所采集到的移动用户情景日志数据集使用汉语分词器ICTCLAS进行分词，将切分出的词进行停用词过滤形成关键词集合；为保证所抽取关键词的质量，对每个关键词计算TF-IDF值，保留大于给定阈值的关键词，使用统一向量表示所采集的移动用户情景日志文件，形成训练语料库。3.如权利要求1所述的移动时空感知下动态即时推荐服务模型建立方法，其特征在于，所述CIT-LDA主题模型，包括：用户u在时刻t选择服务v的概率，通过下式确定：P(v|θ,β,u,t,θ′,C,λ)＝λP(v|θ,β,u,t)+(1-λ)P(v|θ′,C,t)其中，P(v|θ,β,u,t)表示用户u根据自身在时刻t的兴趣分布θ和主题分布β选择服务v的概率；P(v|θ′,C,t)表示服务v被时刻t的移动情景C和移动情景分布θ′生成的概率，t表示当前时间片；参数λ为CIT-LDA模型的混合权重，表示用户自身行为偏好影响的概率，1-λ表示用户受当时移动时空情景影响的概率；对于当前时间片t，以时间片t-1中子主题分布和服务分布的加权作为时间片t中相应分布的先验；时间片t中用户兴趣子主题分布和服务分布的Dirichlet先验满足下式：φt＝φt-1w其中，φt中的每一列对应时间片t-1中的一个兴趣子主题-服务分布，w为权重矩阵。4.如权利要求1所述的移动时空感知下动态即时推荐服务模型建立方法，其特征在于，所述采用对称KL散度计算用户兴趣主题的漂移概率，判断用户兴趣变化点，包括：用户兴趣通过使用移动用户情景日志中特征词汇的出现概率表示，判断不同时期用户兴趣主题间的语义相似性对应于度量两个概率分布间的近似程度；令滑动窗口包含N个时间片，把时间片t中的用户所具有的兴趣j记作原KL散度是不对称的，但不同时期用户兴趣主题间的语义相似性是对称的，即对于任意用户兴趣主题和Tlm，和Tlm的相似性与Tlm和的相似性相等，改进原KL散度，确定基于对称KL散度的用户兴趣子主题相似度为：其中，p(w)和q(w)分别表示特征词汇w在用户兴趣子主题和Tlm中的出现概率，V代表一个词汇字典的集合。5.如权利要求4所述的移动时空感知下动态即时推荐服务模型建立方法，其特征在于，所述前向关联用户兴趣子主题为：滑窗内各时间片i(i＝t-N,…,t-1)中与相似度最大的用户兴趣子主题，记作所述后向关联用户兴趣子主题为：滑窗内各时间片i(i＝t+1,…,t+N)中与相似度最大的用户兴趣子主题，记作6.如权利要求5所述的移动时空感知下动态即时推荐服务模型建立方法，其特征在于，所述新兴趣产生，包括：对于用户兴趣子主...

【专利技术属性】
技术研发人员：崔琳，汪材印，张志伟，宋启祥，吴孝银，李玉林，戚溪溪，
申请(专利权)人：宿州学院，
类型：发明
国别省市：安徽,34

全部详细技术资料下载我是这个专利的主人