用户偏好建模方法、系统及用户偏好评估方法、系统技术方案

技术编号:13323420 阅读:57 留言:0更新日期:2016-07-11 10:24
本发明专利技术提供一种用户偏好建模方法、系统及用户偏好评估方法、系统,所述建模方法包含:步骤101)对多维上下文信息进行挖掘,找出用户行为发生的若干主场景;其中,所述主场景指用户行为发生相对集中的场景;步骤102)将每一个主场景下的用户行为数据作为一个子集,并对子集进行用户偏好信息提取和建模;其中,建模的方法包含:基于“用户-物品”的二元模型。所述步骤101)具体为:对多维上下文数据空间进行挖掘,找出若干主场景;其中,所述上下文数据空间为用户行为数据中描述行为发生上下文环境的所有特征维组成的数据空间;所述主场景由若干上下文特征维上确定的取值或取值范围限定。本发明专利技术有助于减少大量不必要的计算。

【技术实现步骤摘要】

本专利技术涉及个性化信息领域,特别涉及用户偏好建模方法、系统及用户偏好评估方法、系统
技术介绍
经典的个性化模型中通常考虑基于用户和物品两个维度建立,考虑用户使用物品的行为历史,推测用户的个性化需求。基于内容和基于协同的方法是两类基本方法,现有的任何方法都基于至少包含用户和物品两个维度的模型。然而大量研究表明上下文环境影响着用户兴趣,不同上下文环境下用户的个性化需求不同,这导致传统的未考虑上下文环境的个性化系统效果有限。上下文感知计算作为普适计算的重要内容,一直是研究的热点。普适环境中用户手持移动设备可随时随地访问需求的信息。当前,上下文感知计算主要关注于用户在不同环境中的上下文,推导用户的需求并适时提供服务。上下文感知的个性化系统必须在用户和物品的基础上,再考虑上下文这一维度,成为三个抽象维度的模型。常见的上下文信息有:时间、位置、温湿度、光照、场景等环境信息;屏幕大小、处理能力等设备信息;工作状态、身体状态、情绪状态等用户信息。纳入上下文信息维数高,且每一个维度取值通常可以在较大范围内变化,这给上下文感知的兴趣建模带来了很大的挑战。用户的兴趣偏好随着上下文改变,然而那些上下文特征对用户兴趣影响较大,不同上下文特征结合在一起对用户兴趣的影响如何,都是不确定的。现有的纳入上下文的偏好建模记忆行为分析方法通常仅纳入一个维度的上下文来修正原有的“用户-物品”二维模型;或者是这种简单修正在多个维度上的应用。这种方法对于不确定的多维上下文空间,不具有可扩展性和通用性,且需要根据经验小心设计。除了复杂度方面的考虑,这种方法的效果也并不足以满足实际需要。事实上并非每一个上下文特征维都影响着用户的兴趣偏好,且用户的兴趣偏好通常由多个上下文特征维的取值来共同确定。例如,工作日上班时间,用户不论是否在工位上,其个性化需求应处于某种工作模式下;而下班时间,用户处于办公室、娱乐场所或家中,其个性化需求就会有明显区别。也就是说,上下文对用户偏好的影响是通过确定特定的场景来实现的,而且通常只是在若干个上下文特征维度上选定取值就足以确定用户的兴趣分布。另一方面,用户使用对象的行为总是集中发生在某些场景下,而非均匀分布在整个多维上下文数据空间。容易通过聚类等方法找出用户行为集中发生的多维上下文场景,即对应的多维上下文特征向量;通过现有的降维方法筛除掉对用户行为不产生或很少产生影响的上下文特征。据此,考虑通过数据挖掘找出用户行为集中分布的若干场景为“主场景”,并认为用户在任意主场景中的兴趣偏好相对稳定。一个主场景由一个多位上下文向量确定,向量的每一维是一个确定的取值或连续取值范围。
技术实现思路
本专利技术的目的在于设计一种简单通用的建模方法,以反映用户在不同上下文环境下兴趣分布,即个性化需求的分布,即本专利技术提供了一种用户偏好建模方法、系统及基于新建模型的用户对物品或对象的偏好评估的方法和系统。为了实现上述问题,本专利技术提供了一种结合上下文的用户偏好建模方法,所述方法包含:步骤101)对多维上下文信息进行挖掘,找出用户行为发生的若干主场景;其中,所述主场景指用户行为发生相对集中的场景;步骤102)将每一个主场景下的用户行为数据作为一个子集,并对子集进行用户偏好信息提取和建模;其中,建模的方法包含:基于“用户-物品”的二元模型。可选的,上述步骤101)具体为:对多维上下文数据空间进行挖掘,找出若干主场景;其中,所述上下文数据空间为用户行为数据中描述行为发生上下文环境的所有特征维组成的数据空间;所述主场景由若干上下文特征维上确定的取值或取值范围限定。可选的,上述步骤102)进一步包含:步骤102-1)从完整的用户行为数据集中取出选定的任意一个主场景下的用户的所有行为数据;步骤102-2)从用户的所有行为数据中提取描述用户的数据空间和描述对象的数据空间,并基于提取的数据空间信息构成该主场景的数据子集;其中,任意两个不同主场景的数据子集能够存在重叠部分;步骤102-3)对每个主场景对应的数据子集进行挖掘、建模,作为该主场景下的用户偏好模型;其中,每个主场景下的用户偏好建模能够直接采用使用“用户-物品”二维场景的建模方法,针对“用户-物品”的二维建模方法包含:向量空间模型。基于上述方法得到的模型,本专利技术还提供了一种用户对未知对象喜好程度的获取方法,所述方法包含:步骤201)根据当前上下文数据找出匹配主场景,匹配主场景指根据当前上下文场景的完整数据,与全部主场景进行相似度匹配,找出最相似或最匹配场景;步骤202)将当前用户行为与找出的匹配主场景对应的用户模型匹配,进而完成用户对对象的喜好程度;其中,主场景对应的用户模型即提取用户偏好信息建立的用户模型。可选的,上述步骤102)还包含如下步骤:当匹配主场景不止一个时:利用每个主场景下对应的用户偏好模型评估结果结合场景的匹配度综合评估未知对象;或先融合各最匹配主场景的偏好模型为一个模型继而评估未知对象;或再依据设定的策略选择一个最匹配的主场景进行匹配。此外,本专利技术还提供了一种结合上下文的用户偏好建模系统,所述系统包含:主场景提取模块,用于对多维上下文信息进行挖掘,找出用户行为发生的若干主场景;其中,所述主场景指用户行为发生相对集中的场景;建模子模块,用于将每一个主场景下的用户行为数据作为一个子集,并对子集进行用户偏好信息提取和建模;其中,建模的方法包含:基于“用户-物品”的二元模型。可选的,上述主场景提取模块进一步包含:上下文数据空间获取子模块,用于获取用户行为数据中描述行为发生上下文环境的所有特征维组成的数据空间,并将组成的数据空间作为上下文数据空间;主场景提取子模块,用于从所有场景中提取若干个主场景,其中,所述场景是指在若干维度组成子空间里确定的各维度取值或取值区间描述的上下文环境,且场景包含:上下文数据满空间的一个向量描述或一个子空间上的一个向量描述;所述主场景为:用户行为发生相对集中的场景,且所述主场景由若干上下文特征维上确定的取值或取值范围限定。最后,本专利技术还提供了一种用户对未知对象喜好程度的获取系统,所述系统包含:主场景筛选模块,用于根据当前上下文数据找出匹配主场景,匹配主场景指根据当前上下文场景的完整数据,与全部主场景进行相似度匹配,找出最相似或最匹配场景;模型匹配子模块,用于将当前用户行为与找出的匹配主场景对应的用户模型匹配,进而评估本文档来自技高网
...

【技术保护点】
一种结合上下文的用户偏好建模方法,所述方法包含:步骤101)对多维上下文信息进行挖掘,找出用户行为发生的若干主场景;其中,所述主场景指用户行为发生相对集中的场景;步骤102)将每一个主场景下的用户行为数据作为一个子集,并对子集进行用户偏好信息提取和建模;其中,建模的方法包含:基于“用户‑物品”的二元模型。

【技术特征摘要】
1.一种结合上下文的用户偏好建模方法,所述方法包含:
步骤101)对多维上下文信息进行挖掘,找出用户行为发生的若干主场景;其中,
所述主场景指用户行为发生相对集中的场景;
步骤102)将每一个主场景下的用户行为数据作为一个子集,并对子集进行用户
偏好信息提取和建模;其中,建模的方法包含:基于“用户-物品”的二元模型。
2.根据权利要求1所述的结合上下文的用户偏好建模方法,其特征在于,所述
步骤101)具体为:
对多维上下文数据空间进行挖掘,找出若干主场景;其中,所述上下文数据空
间为用户行为数据中描述行为发生上下文环境的所有特征维组成的数据空间;所述
主场景由若干上下文特征维上确定的取值或取值范围限定。
3.根据权利要求1所述的结合上下文的用户偏好建模方法,其特征在于,所述
步骤102)进一步包含:
步骤102-1)从完整的用户行为数据集中取出选定的任意一个主场景下的用户的
所有行为数据;
步骤102-2)从用户的所有行为数据中提取描述用户的数据空间和描述对象的数
据空间,并基于提取的数据空间信息构成该主场景的数据子集;
其中,任意两个不同主场景的数据子集能够存在重叠部分;
步骤102-3)对每个主场景对应的数据子集进行挖掘、建模,作为该主场景下的
用户偏好模型;
其中,每个主场景下的用户偏好建模能够直接采用使用“用户-物品”二维场景
的建模方法,针对“用户-物品”的二维建模方法包含:向量空间模型。
4.一种用户对未知对象喜好程度的获取方法,该方法基于权利要求1-3任意一
条权利要求获得的模型进行用户对未知对象的喜好程度,其特征在于,所述方法为:
步骤201)根据当前上下文数据找出匹配主场景,匹配主场景指根据当前上下文
场景的完整数据,与全部主场景进行相似度匹配,找出最相似或最匹配场景;
步骤202)将当前用户行为与找出的匹配主场景对应的用户模型匹配,进而完成
用户对对象的喜好程度;其中,主场景对应的用户模型即提取用户偏好信息建立的
用户模型。
5.根据权利要求4所述的用户对未知对象喜好程度的获取方法,其特征在于,
所述步骤102)还包含如下步骤:当匹配主场景不止一个时:
利用每个主场景下对应的用户偏好模型评估结果结合场景的匹配度综合评估未

\t知对象;或
先融合各最匹配主场景的偏...

【专利技术属性】
技术研发人员:韩锐李长路郭志川王旭
申请(专利权)人:中国科学院声学研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1