一种基于社交媒体图片的地域分析、推荐方法及系统技术方案

技术编号:17032803 阅读:34 留言:0更新日期:2018-01-13 19:20
本发明专利技术提供一种基于社交媒体图片的地域分析、推荐方法及系统,所述地域分析包括:S1:图片收集:从社交网站上获取各个地区的图片;S2:图片特征提取:对每张收集的图片,用深度神经网络提取固定长度的向量;S3:图片地域分析:根据提取的所有图片的固定长度的特征向量,通过地域特征挖掘模型,将图片特征向量按照相似度进行聚类,将图片类别按照主题进行聚合,计算每个地域特征的图片类别分布,并得到每个地区的地域特征分布。根据以上分布对每个地区进行特征分析,向用户根据其兴趣爱好推荐适合的地区。本发明专利技术通过对图片的利用,使得推荐结果更为精确,从而实现更好的推荐效果。

【技术实现步骤摘要】
一种基于社交媒体图片的地域分析、推荐方法及系统
本专利技术涉及计算机视觉与数据挖掘领域,具体地,涉及一种基于社交媒体图片的地域分析方法及系统,以及地域推荐方法及系统。
技术介绍
随着网络的普及,现今社交媒体已经为人熟知,用户活跃于这些社交媒体,分享自己的生活,对实时进行互动评论。通过对社交媒体数据的分析,可以进一步了解当今各个社会群体的生活状况以及需求,从而提供更人性化的服务,以便利生活。现有技术中已经出现一些根据社交媒体进行地域特点进行分析的文献,比如:公开号为104516961A、申请号为201410800232.5的中国专利技术专利申请,其公开一种基于地域的话题挖掘及话题走势分析方法及系统,话题挖掘包括:按照地域对预定时间段内的网络文章进行分类;抽取每个类的类关键词;针对每个类过滤掉不符合阈值要求的类关键词;对每个类剩余的类关键词进行聚类;判断每个类相关文章数量是否达到预设阈值,如果是则由剩余的类关键词构成一个话题。该专利技术采用基于话题挖掘及走势分析机制,自动挖掘出热门话题,过滤掉大量无关的信息,分析话题的走势,让用户从多个维度了解一个事件的产生发展及消亡情况。上述专利涉及的是通过地域的话题文章等进行地域特点的分析,文字处理相对还是比较方便的计算机处理技术,但是社交媒体中除了文章,还有很多图片,尤其是包含特定地理和人文特征的图片,如果对这些图片进行挖掘分析,展现出每个地域的特征,并按照用户喜好进行推荐,这对提升用户体验和媒体的功能将有很大帮助。目前对于地域特点的分析及推荐,大多都是基于文字性的描述,这导致了对于地域特色都是一些抽象的概念,往往得到的推荐结果不够精确。
技术实现思路
针对现有技术中的缺陷,本专利技术的目的是提供一种基于社交媒体图片的地域分析、推荐方法及系统,通过对图片数据的处理和利用,能很好解决现有方法中重地标而忽略细节,以及过于依赖文字信息的问题。根据本专利技术的一个方面,提供一种基于社交媒体图片的地域分析方法,包括如下步骤:S1:图片收集:从社交网站上获取各个地区的图片;S2:图片特征提取:对每张收集的图片,用深度神经网络提取固定长度的向量;S3:图片地域分析:根据提取的所有图片的固定长度的向量,通过地域特征挖掘模型,将图片特征向量按照相似度进行聚类,将图片类别按照主题进行聚合,计算每个地域特征的图片类别分布,并得到每个地区的地域特征分布。其中,地域特征挖掘模型,是指定聚类数目K1、地域特征数目K、地域数目M,以及每个区域的图片特征,通过变微分推断,计算出高斯分布图片类别分布{φk}k=1,...,K,地域地域特征分布{θm}m=1,...,M。上述的S3,所述图片地域分析采用地域特征挖掘模型,该模型属于一个概率生成模型,它包括图片聚类、地域特征聚合和地域特征分析,所述的图片聚类,是通过地域特征挖掘模型,仅有图片特征的情况下,自动将图片特征进行聚类,对于每一个类别k1,用高斯分布模拟并计算该高斯分布的均值和协方差系数其中I表示单位矩阵;所述的地域特征聚合,是通过地域特征挖掘模型,仅有图片特征的情况下,自动将图片类别进行地域特征聚合,对于每个地域特征k,用多项式分布φk(φk=[(φkk′):k′=1,2,...,K1])模拟图片类别分布,通过对图片特征进行分析计算φk;所述的地域特征分析,是通过地域特征挖掘模型,对每个地域得到一个地域特征分布,对于每个地域m,用多项式分布θm(θm=[(θmk):k=1,2,...,K])模拟地域特征分布,通过对图片特征进行分析计算θm。优选地,所述的图片收集,运用网络爬虫技术从互联网上收集所要分析的地域的图片。优选地,所述的图片特征提取,用在开源GoogLeNet数据集上训练好的深度卷积网络提取收集到的图片的特征M为地域数目。根据本专利技术的第二方面,基于上述地域分析方法,提供一种基于社交媒体图片的地域推荐方法,包括如下步骤:对于一个用户的单张图片,首先利用地域特征挖掘模型对图片进行类别指定,然后采用地域分析方法得到每个地域的特征分布和每个特征的图片类别分布,相乘得到每个地域的图片类别分布,选出在该单张图片的类别上概率值大的地域,进行推荐;对于一个用户的图片集合,采用地域分析方法得到这个图片集合的地域特征分布,然后计算该分布与所有地域的特征分布的欧式距离,选择欧式距离小的地域,进行推荐。根据本专利技术的第三方面,提供一种基于社交媒体图片的地域分析系统,包括:图片收集模块:从社交网站上获取各个地区的图片;图片特征提取模块:对每张从图片收集模块收集的图片,用深度神经网络提取固定长度的向量;图片地域分析模块:根据图片特征提取模块提取的所有图片向量,通过地域特征挖掘模型,将图片特征按照相似度进行聚类,将图片类别按照主题进行聚合,计算每个地域特征的图片类别分布,并计算每个地区的地域特征分布。所述的图片地域分析模块,是一个概率生成模型,它分为图片聚类模块、地域特征聚合模块和地域地域特征分析模块,其中:所述的图片聚类模块,是通过地域特征挖掘模型,仅有图片特征的情况下,自动将图片特征进行聚类,对于每一个类别k1,用高斯分布模拟并计算该高斯分布的均值和协方差系数所述的地域特征聚合模块,是通过地域特征挖掘模型,仅有图片特征的情况下,自动将图片类别进行地域特征聚合,对于每个地域特征k,用多项式分布φk模拟图片类别分布,通过对图片特征进行分析计算φk,即作为概率矩阵φK×K1中的第k行,该多项式分布体现了对于第k个地域特征,每个类对于该特征的贡献程度,即哪些类别对于这一特征更具有代表性,从而使用这些类别对该特征进行表达;所述的地域地域特征分析模块,是通过地域特征挖掘模型,对每个地域得到一个地域特征分布,对于每个地域m,用多项式分布θm模拟地域特征分布,通过对图片特征进行分析计算θm,即作为概率矩阵θM×K中的第m行,该多项式分布体现了对于地域m,各个特征的贡献程度,即通过分布可以决定更具有代表性,从而使用这些特征来描述该地域。根据本专利技术的第四方面,基于上述地域分析系统,提供一种基于社交媒体图片的地域推荐系统,包括:地域推荐模块,所述地域推荐模块包括:单张图片推荐模块:对于一个用户的单张图片,首先利用地域特征挖掘模型对图片进行类别指定,然后采用地域分析方法得到每个地域的特征分布和每个特征的图片类别分布,相乘得到每个地域的图片类别分布,选出在该单张图片的类别上概率值大的地域,进行推荐;图片集合推荐模块:对于一个用户的图片集合,采用地域分析方法得到这个图片集合的地域特征分布,然后计算该分布与所有地域的特征分布的欧式距离,选择欧式距离小的地域,进行推荐。与现有技术相比,本专利技术具有如下的有益效果:本专利技术通过挖掘社交媒体上的图片数据,利用图片数据提出地域特征挖掘的主题模型,将图片通过层次化的结构表示,直观而客观的展现出每个地域的特征。通过对地域特征的分析,再基于用户对于各种地域特征的喜好,可以更好的对用户进行推荐,通过对图片的利用,使得推荐结果更为精确,从而实现更好的推荐效果。本专利技术依据推荐策略的不同可以应用于旅游网站,也可以用于社交媒体中的广告:在旅游网站上,用户可以一改之前的文字搜索模式,从而用图片进行搜索,在社交媒体上,系统会根据用户的相册,推荐相应的旅游地点。附图说明通过阅读参照以下附本文档来自技高网
...
一种基于社交媒体图片的地域分析、推荐方法及系统

【技术保护点】
一种基于社交媒体图片的地域分析方法,其特征在于,包括如下步骤:S1:图片收集:从社交网站上获取各个地区的图片;S2:图片特征提取:对每张收集的图片,用深度神经网络提取固定长度的向量;S3:图片地域分析:根据提取的所有图片的固定长度的向量,通过地域特征挖掘模型,将图片特征向量按照相似度进行聚类,将图片类别按照主题进行聚合,计算每个地域特征的图片类别分布,并得到每个地区的地域特征分布;其中,地域特征挖掘模型,是指定聚类数目K

【技术特征摘要】
1.一种基于社交媒体图片的地域分析方法,其特征在于,包括如下步骤:S1:图片收集:从社交网站上获取各个地区的图片;S2:图片特征提取:对每张收集的图片,用深度神经网络提取固定长度的向量;S3:图片地域分析:根据提取的所有图片的固定长度的向量,通过地域特征挖掘模型,将图片特征向量按照相似度进行聚类,将图片类别按照主题进行聚合,计算每个地域特征的图片类别分布,并得到每个地区的地域特征分布;其中,地域特征挖掘模型,是指定聚类数目K1、地域特征数目K、地域数目M,以及每个区域的图片特征,通过变微分推断,计算出高斯分布图片类别分布{φk}k=1,...,K,地域地域特征分布{θm}m=1,...,M。2.根据权利要求1所述的基于社交媒体图片的地域分析方法,其特征在于,上述的S3,所述图片地域分析采用一个概率生成模型,它包括图片聚类、地域特征聚合和地域特征分析:所述的图片聚类,是通过地域特征挖掘模型,仅有图片特征的情况下,自动将图片特征进行聚类,对于每一个类别k1,用高斯分布模拟并计算该高斯分布的均值和协方差系数其中I为单位矩阵;所述的地域特征聚合,是通过地域特征挖掘模型,仅有图片特征的情况下,自动将图片类别进行地域特征聚合,对于每个地域特征k,用多项式分布φk模拟图片类别分布,通过对图片特征进行分析计算φk;所述的地域特征分析,是通过地域特征挖掘模型,对每个地域得到一个地域特征分布,对于每个地域m,用多项式分布θm模拟地域特征分布,通过对图片特征进行分析计算θm。3.根据权利要求1或2所述的基于社交媒体图片的地域分析方法,其特征在于,所述的图片收集,运用网络爬虫技术从互联网上收集所要分析的地域的图片。4.根据权利要求1或2所述的基于社交媒体图片的地域分析方法,其特征在于,所述的图片特征提取,用在开源GoogLeNet数据集上训练好的深度卷积网络提取收集到的图片的特征M为地域数目。5.一种基于权利要求1-4任一项所述方法的基于社交媒体图片的地域推荐方法,其特征在于:对于一个用户的单张图片,首先利用地域特征挖掘模型对图片进行类别指定,然后采用权利要求1-4任一项所述地域分析方法得到每个地域的特征分布和每个特征的图片类别分布,相乘得到每个地域的图片类别分...

【专利技术属性】
技术研发人员:王延峰张娅郑煌杰姚江超
申请(专利权)人:上海交通大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1