A system for discovering user interest by using online social media is described, and more specifically, a way of doing this by means of bidirectional graph model. During operation, the system generates confidence matrix F based on user interaction and co-occurrence tags on the social media platform. The confidence matrix F indicates the possibility that users are interested in a particular topic in a social media platform. Based on this possibility, the users who are interested in a particular topic exceed the predetermined threshold, initiate actions on a specific topic. For example, the system generates and displays users' online advertisements on specific topics, which are more likely to be interested in specific topics than those with a predetermined threshold.
【技术实现步骤摘要】
【国外来华专利技术】用于借助社交媒体识别用户兴趣的系统和方法政府权利本专利技术在由IARPA发布的美国政府合同号D12PC00285下由政府支持做出。政府在本专利技术中具有特定权利。相关申请的交叉引用这是2015年8月6日提交的第62/201,738号美国临时申请的非临时专利申请,在此以引证方式将该申请的全文并入。
本专利技术涉及一种用于发现用户兴趣的系统,并且更具体地,涉及一种用于使用双向图模型借助在线社交媒体发现用户兴趣的系统。
技术介绍
对从在线社交媒体发现用户兴趣和主题越来越受关注(参见所并入参考文献列表,第3和4号参考文献)。一种常见方法是使用从用户的所有帖子的文本生成的向量表示来表示用户的兴趣。然后,可以由两个用户的特征向量的相似性得分测量两个用户之间的相似性。这还被称为词袋方法。然而,这种方法非常易受嘈杂文本影响。这在社交媒体环境中更为严重,这是因为用户自由地发布可能不反映他们感兴趣的真正主题的关于他们生活的任意帖子。用于隐藏用户主题发现的另一种深入研究方法是基于LDA(潜在狄利克雷分配,LatentDirichletAllocation)的方法。已经使用基于LDA的方法的一些研究可以在第1、4和8号参考文献中看到。因为LDA依赖词袋假定,所以它具有类似缺点。另外,对LDA的计算要求通常较高,并且它对方法的可扩展性形成显著瓶颈。识别兴趣的另一种方法是分析如在社交和主题空间中构造的网络拓扑。在第2号参考文献中,作者调查互易Twitter追随者网络中的用户社区,并且将用户兴趣总结为几类。在第5号参考文献中,作者提出通过对用户感兴趣的主题建模来链接由用户张贴的推文中的 ...
【技术保护点】
一种用于借助社交媒体识别用户兴趣的系统,所述系统包括:一个或更多个处理器和存储器,所述存储器为上面编码有可执行指令的非暂时性计算机可读介质,使得在执行所述指令时,所述一个或更多个处理器执行以下操作:基于社交媒体平台上的用户交互和同现标签生成置信度矩阵F,所述置信度矩阵F指示所述社交媒体平台中的用户对特定主题感兴趣的可能性;以及针对对特定主题感兴趣的可能性超过预定阈值的那些用户发起与所述特定主题有关的动作。
【技术特征摘要】
【国外来华专利技术】2015.08.06 US 62/201,7381.一种用于借助社交媒体识别用户兴趣的系统,所述系统包括:一个或更多个处理器和存储器,所述存储器为上面编码有可执行指令的非暂时性计算机可读介质,使得在执行所述指令时,所述一个或更多个处理器执行以下操作:基于社交媒体平台上的用户交互和同现标签生成置信度矩阵F,所述置信度矩阵F指示所述社交媒体平台中的用户对特定主题感兴趣的可能性;以及针对对特定主题感兴趣的可能性超过预定阈值的那些用户发起与所述特定主题有关的动作。2.根据权利要求1所述的系统,所述系统还包括以下操作:基于社交媒体平台上的用户交互的集合构造用户交互网络W;基于所述社交媒体平台上的同现标记的集合构造标签同现网络Rh;基于所述标签同现网络Rh构造主题相关网络R;从所述用户交互网络W生成用户图拉普拉斯Lg;从所述主题相关网络R生成主题图拉普拉斯Lc;以及基于初始已知用户主题关联生成初始标签分配矩阵Y。3.根据权利要求2所述的系统,其中,在生成主题相关网络R时,通过对Rh应用Louvain社区检测来生成所述主题相关网络。4.根据权利要求3所述的系统,其中,置信度矩阵F的行表示用户,并且列表示主题,使得所述置信度矩阵F的各条目指示用户对特定主题感兴趣的可能性。5.根据权利要求4所述的系统,其中,发起动作还包括以下操作:生成并且向对特定主题感兴趣的可能性超过预定阈值的那些用户呈现关于所述特定主题的针对用户的在线广告。6.根据权利要求1所述的系统,其中,置信度矩阵F的行表示用户,并且列表示主题,使得所述置信度矩阵F的各条目指示用户对特定主题感兴趣的可能性。7.根据权利要求1所述的系统,其中,发起动作还包括以下操作:生成并且向对特定主题感兴趣的可能性超过预定阈值的那些用户呈现关于所述特定主题的针对用户的在线广告。8.一种用于借助社交媒体识别用户兴趣的方法,所述方法包括以下动作:基于社交媒体平台上的用户交互和同现标签利用一个或更多个处理器生成置信度矩阵F,所述置信度矩阵F指示所述社交媒体平台中的用户对特定主题感兴趣的可能性;以及利用所述一个或更多个处理器针对对特定主题感兴趣的可能性超过预定阈值的那些用户发起与所述特定主题有关的动作。9.根据权利要求8所述的方法,所述方法还包括以下操作:基于社交媒体平台上的用户交互的集合构造用户交互网络W;基于所述社交媒体平台上的同现标签的集合构造标签同现网络Rh;基于所述标签同现网络Rh构造主题相关网络R;从所述用户交互网络W生成用户图拉普拉斯Lg;从所述主题相关网络R生成主题图拉普拉斯Lc;以及基于初始已知用户主题关联生成初始标签分配矩阵Y。10.根据权利要求9所述的方法,其中,在...
【专利技术属性】
技术研发人员:许劼钧,TC·卢,
申请(专利权)人:赫尔实验室有限公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。