【技术实现步骤摘要】
本专利技术涉及多媒体搜索领域,特别涉及。
技术介绍
社会媒体(Social Media)已经极大地改变了用户分享和获取信息的方式和习惯。在社会媒体服务中,用户不可避免地与其他用户交互构成社区,即所谓的社会网络。社会网络中包括双向的社会关系,如LinkedIn中的“关联(Connect) ”和Facebook中的“加为好友(Add Friend) ”,以及单向的社会关系,如Twitter中的“跟随(Follow) ”和Youtube中的“订阅(Subscribe) ”。这些社会关系被认为影响着用户的行为以及社会网络的动态发展。如,LinkedIn上的同事可以影响一个人工作上的选择,Facebook上的好友则会影响一个人生活中的行为和需求。通过分析和挖掘这些社会关系可以促生很多重要的应用,如病毒式营销、协同推荐和协同信息搜索等等。以基于单向社会关系的多媒体协同搜索为例,其基本假设和出发点是通过分析对搜索用户有影响关系的其他用户的行为,可以预测搜索用户的真实需求并调整搜索结果。目前针对社会关系挖掘的方法,主要集中于研究是否存在社会关系以及社会关系的强度预测。在很多问题中,二值化或者连续的社会关系并不能满足应用的需求。如在多媒体搜索问题中,对于不同的搜索词,用户之间的社会关系是不同的。假设用户要为自己的蜜月旅行搜索“夏威夷”的照片,有旅游特长的好友会对他的帮助最大,我们希望他们之间的社会关系变强;而当同一个用户搜索“时装秀”的照片时,则会希望对流行时尚有研究的好友能更多地影响搜索结果,即他们之间的社会关系变强。我们称这种与问题相关的社会关系为自适应的社会关系强度 ...
【技术保护点】
一种基于多模态自适应社会关系强度挖掘的社会搜索方法,该方法包括步骤如下:步骤1:收集用户上传的图片信息以及与其有单向社会关系的用户,每个用户对应一个由上传图像集合、图像标注集合和与其有单向社会关系的关系用户集合组成的三元组;步骤2:根据输入的三元组,建立多模态概率生成式模型,将所述图像集合中的图片内容和图像标注集合中的图像标注信息的生成过程进行推断;步骤3:根据推断结果计算用户主题空间和用户主题分布,计算用户与用户之间的主题敏感的社会关系强度;步骤4:根据所得到的用户主题空间、用户主题分布以及社会关系强度对搜索结果进行排序。
【技术特征摘要】
1.一种基于多模态自适应社会关系强度挖掘的社会搜索方法,该方法包括步骤如下 步骤1:收集用户上传的图片信息以及与其有单向社会关系的用户,每个用户对应一个由上传图像集合、图像标注集合和与其有单向社会关系的关系用户集合组成的三元组; 步骤2:根据输入的三元组,建立多模态概率生成式模型,将所述图像集合中的图片内容和图像标注集合中的图像标注信息的生成过程进行推断; 步骤3 :根据推断结果计算用户主题空间和用户主题分布,计算用户与用户之间的主题敏感的社会关系强度; 步骤4:根据所得到的用户主题空间、用户主题分布以及社会关系强度对搜索结果进行排序。2.如权利要求1所述的方法,其特征在于,所述步骤I包括 步骤11 :对每个用户U,根据其社会关系网络采集与其有单向社会关系的用户,组成集合Cu ; 步骤12 :对每个用户U,采集其上传的图片,组成集合Du; 步骤13 :对每个用户U,采集其对所上传的图片添加的标注,组成集合Tu。3.如权利要求1所述的方法,其特征在于,所述步骤2包括 步骤21 :建立主题敏感的多模态概率生成式模型,来模拟图片和标注的生成过程;其中通过设置隐变量来描述建立多模态概率生成式模型的过程;其中,所述隐变量包括开关隐变量S、主题记录隐变量z和采样用户隐变量C,所述开关隐变量s表示标注词和图像是用户自发产生还是受关系用户影响而产生的;所述主题记录隐变量z表示采样得到的主题;所述用户隐变量c表示采样得到的关系用户; 步骤22 :求解所述多模态概率生成式模型,其中通过吉布斯采样推断得到所述隐变量的取值。4....
【专利技术属性】
技术研发人员:徐常胜,桑基韬,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市: