【技术实现步骤摘要】
基于层次化主题偏好语义矩阵的关注关系识别及标注方法
本专利技术涉及社交网络可解释性链路预测方法
,具体涉及基于层次化主题偏好语义矩阵的关注关系识别及标注方法。
技术介绍
在社交网络中,用户之间的关注关系能够形成关注网络结构。在许多的关注关系社交网络中,用户可能对不同类型的主题和不同层次的主题具有不同的兴趣点,通过探索用户间关注关系在不同类型主题以及不同层次主题下的隐含语义联系,可以深入挖掘用户的关注关系兴趣动机所在,从而更容易发现用户的潜在关注用户,建立更可信的关注关系预测解释。一位用户关注了另一位用户,则可能转发该用户的微博内容,或点赞该微博内容。通过分析两个用户发布的微博内容,能够在某些潜在的共同兴趣特征上发现语义相似性,预测用户之间的关注行为;同时用户的兴趣具有层次化结构,两个在CBA主题上建立关注关系的用户比两个在篮球主题上建立关注关系的用户更具有语义的解释性。基于用户间潜在兴趣主题提取细粒度的可解释性的关注关系原因能够提升推荐系统链路预测的性能。社交网络中的关注关系链路预测通常依赖于网络结构,基于网络 ...
【技术保护点】
1.基于层次化主题偏好语义矩阵的关注关系识别及标注方法,其特征在于:包括以下步骤:/n步骤S1,构建主题偏好语义矩阵初始化的关注关系网络图;/n步骤S2,学习基于翻译模型的层次化主题偏好语义矩阵;/n步骤S3,通过偏好语义矩阵标注网络节点关注关系;/n步骤S4,基于用户文本内容解释层次化主题偏好语义矩阵;/n步骤S5,计算新用户与其他用户节点在层次化主题下的相关性;/n步骤S6,选取具有最大相关性的层次化主题标注用户间关注关系;/n步骤S7,标记关注关系的层次化主题偏好语义矩阵;/n步骤S8,依据用户文本内容解释偏好语义矩阵。/n
【技术特征摘要】
1.基于层次化主题偏好语义矩阵的关注关系识别及标注方法,其特征在于:包括以下步骤:
步骤S1,构建主题偏好语义矩阵初始化的关注关系网络图;
步骤S2,学习基于翻译模型的层次化主题偏好语义矩阵;
步骤S3,通过偏好语义矩阵标注网络节点关注关系;
步骤S4,基于用户文本内容解释层次化主题偏好语义矩阵;
步骤S5,计算新用户与其他用户节点在层次化主题下的相关性;
步骤S6,选取具有最大相关性的层次化主题标注用户间关注关系;
步骤S7,标记关注关系的层次化主题偏好语义矩阵;
步骤S8,依据用户文本内容解释偏好语义矩阵。
2.根据权利要求1所述基于层次化主题偏好语义矩阵的关注关系识别及标注方法,其特征在于:所述步骤S1,构建主题偏好语义矩阵初始化的关注关系网络图还包括以下步骤:
步骤S1.1,根据用户的关注关系,建立关注关系图G(V,R),其中V为节点的集合,R为边的集合;关注关系图中的节点表示用户,边表示用户间的关注关系r,若用户h关注了用户t,则构建从用户h指向用户t的一条边;其中,h、t均表示用户;关注关系图描述了用户之间的显式的社会化关注关系,有利于用来预测用户之间的潜在关注关系;
步骤S1.2,基于用户h发布的文本内容提取关键词集合Sh;基于用户t发布的文本内容提取关键词集合St;根据Sh、St分别计算与中文维基百科l层N个粗粒度主题的jaccard相似度系数,选取用户h和用户t的相似度高的m个粗粒度主题解释用户间的关注关系,并初始化m个粗粒度主题偏好语义矩阵在l层粗粒度主题基础上,根据Sh、St分别计算与中文维基百科l+1层P个细粒度主题的jaccard相似度系数,选取用户h和用户t的相似度高的q个细粒度主题解释用户间的关注关系,并初始化q个细粒度主题偏好语义矩阵粗粒度主题c的细粒度主题集合记为Child(c)={c1,c2,...,ck,...,cb}。
3.根据权利要求1所述基于层次化主题偏好语义矩阵的关注关系识别及标注方法,其特征在于:所述步骤S2,学习基于翻译模型的层次化主题偏好语义矩阵还包括以下步骤:
步骤S2.1,基于关注关系图上的用户h,用户t及关注关系建立三元组(h,r,t),r为用户h到用户t的关注关系;进而在粗粒度主题方面基于翻译模型建模用户和关系的表示,给定粗粒度主题c,记用户h在粗粒度主题c方面的向量表示为用户t在粗粒度主题c方面的向量表示为其中,分别为用户h和用户t的向量表示;用户h和用户t的向量表示映射到粗粒度主题c方面的关系空间,得到粗粒度主题c方面的关系空间的向量表示
步骤S2.2,基于粗粒度主题c关于关注关系的解释作用,通过粗粒度主题c的细粒度主题Child(c)={c1,c2,...,ck,...,cb}可以进一步详细描述刻画用户间的关注关系;设ck为粗粒度主题c的第k个细粒度主题,当粗粒度主题c为篮球时,则细粒度主题ck表示CBA,在粗粒度主题c的主题偏好语义矩阵的基础上,学习细粒度主题ck的主题偏好语义矩阵用户h在细粒度主题ck上的向量表示用户t在细粒度主题ck上的向量表示建立用户h和用户t在粗粒度主题c的细粒度主题ck上的关注关系距离函数为:
其中,表示用户h和用户t在细粒度主题ck方面的关注关系r上的距离函数;代表用户h在细粒度主题ck方面的向量表示;代表用户t在细粒度主题ck方面的向量表示;代表用户u和用户v的关注关系r的空间表示;
步骤S2.3,根据三元组(h,r,t)的距离函数,对于具有真实关注关系r的正样本三元组(h,r,t)和不具有关注关系r...
【专利技术属性】
技术研发人员:郑建兴,李沁文,李德玉,梁吉业,
申请(专利权)人:山西大学,
类型:发明
国别省市:山西;14
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。