用于借助社交媒体识别用户兴趣的系统和方法技术方案

技术编号:17310215 阅读:23 留言:0更新日期:2018-02-19 10:07
描述了一种用于借助在线社交媒体发现用户兴趣的系统,并且更具体地,涉及一种借助于双向图模型这样做的方式。在操作期间,该系统基于社交媒体平台上的用户交互和同现标签生成置信度矩阵F。置信度矩阵F指示社交媒体平台中的用户对特定主题感兴趣的可能性。基于这种可能性,对于对特定主题感兴趣的可能性超过预定阈值的那些用户,发起关于特定主题的动作。例如,该系统生成并且向对特定主题感兴趣的可能性超过预定阈值的那些用户呈现关于特定主题的针对用户的在线广告。

Systems and methods used to identify user interests with the help of social media

A system for discovering user interest by using online social media is described, and more specifically, a way of doing this by means of bidirectional graph model. During operation, the system generates confidence matrix F based on user interaction and co-occurrence tags on the social media platform. The confidence matrix F indicates the possibility that users are interested in a particular topic in a social media platform. Based on this possibility, the users who are interested in a particular topic exceed the predetermined threshold, initiate actions on a specific topic. For example, the system generates and displays users' online advertisements on specific topics, which are more likely to be interested in specific topics than those with a predetermined threshold.

【技术实现步骤摘要】
【国外来华专利技术】用于借助社交媒体识别用户兴趣的系统和方法政府权利本专利技术在由IARPA发布的美国政府合同号D12PC00285下由政府支持做出。政府在本专利技术中具有特定权利。相关申请的交叉引用这是2015年8月6日提交的第62/201,738号美国临时申请的非临时专利申请,在此以引证方式将该申请的全文并入。
本专利技术涉及一种用于发现用户兴趣的系统,并且更具体地,涉及一种用于使用双向图模型借助在线社交媒体发现用户兴趣的系统。
技术介绍
对从在线社交媒体发现用户兴趣和主题越来越受关注(参见所并入参考文献列表,第3和4号参考文献)。一种常见方法是使用从用户的所有帖子的文本生成的向量表示来表示用户的兴趣。然后,可以由两个用户的特征向量的相似性得分测量两个用户之间的相似性。这还被称为词袋方法。然而,这种方法非常易受嘈杂文本影响。这在社交媒体环境中更为严重,这是因为用户自由地发布可能不反映他们感兴趣的真正主题的关于他们生活的任意帖子。用于隐藏用户主题发现的另一种深入研究方法是基于LDA(潜在狄利克雷分配,LatentDirichletAllocation)的方法。已经使用基于LDA的方法的一些研究可以在第1、4和8号参考文献中看到。因为LDA依赖词袋假定,所以它具有类似缺点。另外,对LDA的计算要求通常较高,并且它对方法的可扩展性形成显著瓶颈。识别兴趣的另一种方法是分析如在社交和主题空间中构造的网络拓扑。在第2号参考文献中,作者调查互易Twitter追随者网络中的用户社区,并且将用户兴趣总结为几类。在第5号参考文献中,作者提出通过对用户感兴趣的主题建模来链接由用户张贴的推文中的实体指代(mentions)的基于图的框架。前述方法的一个共性是两种方法在它们的分析中仅聚焦于一种类型的网络拓扑(例如,用户为中心的网络或主题为中心的网络),这不允许以统一方式查阅多个网络中的双关系方面。由此,持续需要一种可以用于通过以统一方式将两个(用户和主题)网络的拓扑用于用户兴趣建模,借助在线社交媒体高效且有效地发现用户兴趣的系统。
技术实现思路
本公开提供了一种用于借助在线社交媒体识别用户兴趣的系统。该系统包括一个或更多个处理器和上面编码有指令的关联存储器(例如,硬盘驱动器等)。在执行指令时,一个或更多个处理器执行多个操作。例如,在操作期间,该系统基于社交媒体平台(例如,Twitter、Tumblr或任意其它社交媒体平台)上的用户交互和同现标签生成置信度矩阵F。置信度矩阵F指示社交媒体平台中的用户对特定主题感兴趣的可能性。基于这种可能性,可以针对对特定主题感兴趣的可能性超过预定阈值的那些用户发起关于特定主题的动作。例如,该系统可以生成并且向对特定主题感兴趣的可能性超过预定阈值(例如,大于50%或如操作员认为适当的任意其它预定阈值)的那些用户呈现关于特定主题的针对用户的在线广告。在另一个方面中,该系统执行以下操作:基于社交媒体平台上的用户交互的集合构造用户交互网络W;基于社交媒体平台上的同现标签的集合构造标签同现网络Rh;基于标签同现网络Rh构造主题相关网络R;从用户交互网络W生成用户图拉普拉斯Lg;从主题相关网络R生成主题图拉普拉斯Lc;以及基于初始已知用户主题关联(association)生成初始标签(label)分配矩阵Y。进一步地,在生成主题相关网络R时,通过对Rh应用Louvain社区检测来生成主题相关网络。在又一个方面中,置信度矩阵F的行表示用户,并且列表示主题,使得置信度矩阵F的各条目指示用户对特定主题感兴趣的可能性。最后,本专利技术还包括计算机程序产品和计算机实现方法。计算机程序产品包括存储在非暂时性计算机可读介质上的计算机可读指令,这些指令可由具有一个或更多个处理器的计算机执行,使得在执行指令时,一个或更多个处理器执行这里所列出的操作。另选地,计算机实现方法包括使得计算机执行这种指令并执行所得到的操作的动作。附图说明本专利技术的目的、特征以及优点将从本专利技术的各种方面的以下具体描述连同以下附图而变得清晰,附图中:图1是描绘了根据本专利技术的各种实施方式的系统的组件的框图;图2是具体实现本专利技术的一方面的计算机程序产品的例示;图3是根据本专利技术的各种实施方式的用户兴趣建模的双关系图的例示;图4A是示例标签网络的例示。图4B是与在图4A中描绘的标签网络关联的示例主题网络的例示;图4C是示例标签网络的例示。图4D是与在图4C中描绘的标签网络关联的示例主题网络的例示;以及图5是例示了根据本专利技术的各种实施方式的用于识别用户兴趣的过程的流程图。具体实施方式本专利技术涉及一种用于发现用户兴趣的系统,并且更具体地,涉及一种用于使用双向图模型借助在线社交媒体发现用户兴趣的系统。以下描述被提出为使得本领域普通技术人员能够进行并使用本专利技术并将本专利技术并入特定应用的环境中。各种修改以及不同应用中的各种使用对于本领域技术人员来说更明显,并且这里所定义的一般原理可以应用于广泛方面。由此,本专利技术不旨在限于所提出的方面,而是符合与这里所公开的原理和新型特征一致的最宽范围。在以下具体描述中,为了提供本专利技术的更彻底理解,阐述了大量具体细节。然而,将对本领域技术人员显而易见的是,本专利技术可以在不必限于这些具体细节的情况下被实践。在其它情况下,为了避免使本专利技术模糊,以框图形式而不是详细示出公知结构和装置。读者的注意力在于与本说明书同时提交且与本说明书一起对公众审查公开的所有文献,并且以引证的方式将所有这种文献的内容并入于此。本说明书(包括任意所附权利要求、摘要以及附图)中所公开的所有特征可以用服务相同、等效或类似目的的另选特征来替换,除非另外明确阐述。由此,除非另外明确阐述,所公开的各特征仅为一般系列等效或类似特征的一个示例。此外,权利要求中未明确阐述用于执行指定功能的“装置”或用于执行特定功能的“步骤”的任何元素不被解释为如35U.S.C第112章节第6段中指定的“装置”或“步骤”条款。具体地,这里权利要求中“的步骤”或“的动作”的使用不旨在涉及35U.S.C112第6段中的规定。在详细描述本专利技术之前,首先提供所列举参考文献的列表。接着,提供本专利技术的各种主要方面的描述。随后,引言给读者提供本专利技术的一般理解。最后,提供本专利技术的各种实施方式的具体细节,以给出特定方面的理解。(1)所并入参考文献的列表贯穿本申请列举以下参考文献。为了清晰和方便起见,参考文献在这里被列出为读者的中心资源。以下参考文献通过引用被并入于此,就像被完全阐述一样。参考文献如下通过参考对应参考文献号列举在本申请中:1.Harvey,M.,Crestani,F.,&Carman,M.J.(2013).BuildingUserProfilesfromTopicModelsforPersonalised.ConferenceonInformationandKnowiedgeManagemeni(CIKM),SanFrancisco.2.Java,A.,Song,X.,Finin,T.,&Tseng,B.(2007).Whywetwitter:Understandingmicrobloggingusageandcommunities.InProc,9thWebKDDand1stSNA-KDDWorkshoponWebM本文档来自技高网
...
用于借助社交媒体识别用户兴趣的系统和方法

【技术保护点】
一种用于借助社交媒体识别用户兴趣的系统,所述系统包括:一个或更多个处理器和存储器,所述存储器为上面编码有可执行指令的非暂时性计算机可读介质,使得在执行所述指令时,所述一个或更多个处理器执行以下操作:基于社交媒体平台上的用户交互和同现标签生成置信度矩阵F,所述置信度矩阵F指示所述社交媒体平台中的用户对特定主题感兴趣的可能性;以及针对对特定主题感兴趣的可能性超过预定阈值的那些用户发起与所述特定主题有关的动作。

【技术特征摘要】
【国外来华专利技术】2015.08.06 US 62/201,7381.一种用于借助社交媒体识别用户兴趣的系统,所述系统包括:一个或更多个处理器和存储器,所述存储器为上面编码有可执行指令的非暂时性计算机可读介质,使得在执行所述指令时,所述一个或更多个处理器执行以下操作:基于社交媒体平台上的用户交互和同现标签生成置信度矩阵F,所述置信度矩阵F指示所述社交媒体平台中的用户对特定主题感兴趣的可能性;以及针对对特定主题感兴趣的可能性超过预定阈值的那些用户发起与所述特定主题有关的动作。2.根据权利要求1所述的系统,所述系统还包括以下操作:基于社交媒体平台上的用户交互的集合构造用户交互网络W;基于所述社交媒体平台上的同现标记的集合构造标签同现网络Rh;基于所述标签同现网络Rh构造主题相关网络R;从所述用户交互网络W生成用户图拉普拉斯Lg;从所述主题相关网络R生成主题图拉普拉斯Lc;以及基于初始已知用户主题关联生成初始标签分配矩阵Y。3.根据权利要求2所述的系统,其中,在生成主题相关网络R时,通过对Rh应用Louvain社区检测来生成所述主题相关网络。4.根据权利要求3所述的系统,其中,置信度矩阵F的行表示用户,并且列表示主题,使得所述置信度矩阵F的各条目指示用户对特定主题感兴趣的可能性。5.根据权利要求4所述的系统,其中,发起动作还包括以下操作:生成并且向对特定主题感兴趣的可能性超过预定阈值的那些用户呈现关于所述特定主题的针对用户的在线广告。6.根据权利要求1所述的系统,其中,置信度矩阵F的行表示用户,并且列表示主题,使得所述置信度矩阵F的各条目指示用户对特定主题感兴趣的可能性。7.根据权利要求1所述的系统,其中,发起动作还包括以下操作:生成并且向对特定主题感兴趣的可能性超过预定阈值的那些用户呈现关于所述特定主题的针对用户的在线广告。8.一种用于借助社交媒体识别用户兴趣的方法,所述方法包括以下动作:基于社交媒体平台上的用户交互和同现标签利用一个或更多个处理器生成置信度矩阵F,所述置信度矩阵F指示所述社交媒体平台中的用户对特定主题感兴趣的可能性;以及利用所述一个或更多个处理器针对对特定主题感兴趣的可能性超过预定阈值的那些用户发起与所述特定主题有关的动作。9.根据权利要求8所述的方法,所述方法还包括以下操作:基于社交媒体平台上的用户交互的集合构造用户交互网络W;基于所述社交媒体平台上的同现标签的集合构造标签同现网络Rh;基于所述标签同现网络Rh构造主题相关网络R;从所述用户交互网络W生成用户图拉普拉斯Lg;从所述主题相关网络R生成主题图拉普拉斯Lc;以及基于初始已知用户主题关联生成初始标签分配矩阵Y。10.根据权利要求9所述的方法,其中,在...

【专利技术属性】
技术研发人员:许劼钧TC·卢
申请(专利权)人:赫尔实验室有限公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1