当前位置: 首页 > 专利查询>华侨大学专利>正文

基于社交网络知识图谱的跨网络人物关联方法技术

技术编号:21832833 阅读:37 留言:0更新日期:2019-08-10 18:04
本发明专利技术公开了基于社交网络知识图谱的跨网络人物关联方法,属于知识图谱与社交网络分析领域,包括以下步骤:步骤1.训练词向量;步骤2.发现候选实体;步骤3.根据社交网络知识图谱的结构特征,计算网络度量指标;步骤4.用户向量生成;步骤5.定义社交网络结构相似度和用户画像语义相似度;步骤6.融合相似度计算,根据融合相似度确定待关联的人物实体的跨网络人物关联的最终节点。该发明专利技术可用于社交网络中挖掘用户信息,发现重要节点,也可以用作对重要节点信息的补全,为精准推荐提供数据支撑。

Cross-network Person Association Method Based on Knowledge Map of Social Networks

【技术实现步骤摘要】
基于社交网络知识图谱的跨网络人物关联方法
本专利技术涉及知识图谱与社交网络分析领域,特别是指基于社交网络知识图谱的跨网络人物关联方法。
技术介绍
随着社交网络的日益普及,数亿人花费大量的时间在社会媒体上以史无前例的速度分享、交流、联系和互动,并产生了海量的用户生成数据。利用社交媒体数据做社交媒体挖掘已经成为了一个快速发展的新领域。研究表明:至少50%的用户拥有两个或者多个社交网络账号,90%的新浪微博用户使用微信,至少80%的Facebook用户使用Twitter。所以分析不同社交网络的相同用户对于发现用户兴趣爱好,情感倾向等方面都有重要的意义。尽管社交网络数据呈现指数级的增长,用户在社交网络上的用户信息往往是不全面的。在具体的场景下,用户在一个社交网络平台上的邮箱是存在的,然而在另一个社交网络中可能是不存在的,因此通过关联不同社交网络中的相同用户,可以获取用户在其他社交网络中的属性信息和关系信息,用做社交网络知识图谱的补全和质量评估工作。目前主流的跨网络用户关联方法,一般是对社交网络用户的注册用户信息进行分析,通过分析社交网络中的用户名、昵称、地理位置等属性,设计用户的相似度矩阵,本文档来自技高网...

【技术保护点】
1.基于社交网络知识图谱的跨网络人物关联方法,其特征在于,包括如下步骤:步骤1.建立Structural Skip‑Gram词向量训练模型,训练语义表征能力更强的词向量;步骤2.利用社交网络知识图谱中存储的人物实体的属性,寻找与待关联人物实体相关的候选人物实体;步骤3.根据社交网络知识图谱的结构特征,计算每一个候选人物实体与待关联人物实体的网络度量指标,其包括属性系数、PageRank值、中间中心性、特征向量中心性和聚类系数;步骤4.基于社交网络知识图谱对候选人物实体与待关联人物实体构造用户画像,并使用训练好的Structural Skip‑Gram词向量模型将用户画像表征为用户向量;步骤5....

【技术特征摘要】
1.基于社交网络知识图谱的跨网络人物关联方法,其特征在于,包括如下步骤:步骤1.建立StructuralSkip-Gram词向量训练模型,训练语义表征能力更强的词向量;步骤2.利用社交网络知识图谱中存储的人物实体的属性,寻找与待关联人物实体相关的候选人物实体;步骤3.根据社交网络知识图谱的结构特征,计算每一个候选人物实体与待关联人物实体的网络度量指标,其包括属性系数、PageRank值、中间中心性、特征向量中心性和聚类系数;步骤4.基于社交网络知识图谱对候选人物实体与待关联人物实体构造用户画像,并使用训练好的StructuralSkip-Gram词向量模型将用户画像表征为用户向量;步骤5.基于网络度量指标定义社交网络结构相似度,基于用户向量定义人物实体的用户向量语义相似度;步骤6.根据社交网络结构相似度和用户向量语义相似度计算人物实体的融合相似度,根据融合相似度确定待关联的人物实体的跨网络人物关联的最终节点。2.如权利要求1所述的基于社交网络知识图谱的跨网络人物关联方法,其特征在于,所述步骤1中,训练语义表征能力更强的词向量包括:步骤1.1获取的社交网络语料并进行数据预处理,包括中文分词和去停用词;步骤1.2基于Skip-Gram模型,加入多个投影层,用于表征上下文词序信息;步骤1.3定义Skip-Gram模型的目标函数,完成StructuralSkip-Gram词向量模型的训练。3.如权利要求1所述的基于社交网络知识图谱的跨网络人物关联方法,其特征在于,所述步骤2具体包括如下:首先,确定社交网络知识图谱中待关联人物实体的指称项v;然后,对社交网络知识图谱的设有人物实体指称项v的属性进行查询,查询与该待关联人物实体的指称项v属性相同的人物实体;最后,将匹配到的所有人物实体作为跨网络人物关联的候选人物实体集合。4.如权利要求1所述的基于社交网络知识图谱的跨网络人物关联方法,其特征在于,所述步骤3中,所述网络度量指标的计算方法如下:步骤3.1基于社交网络知识图谱人物实体的用户名属性,经过词向量表征后,求每一维向量的平均值,作为人物实体的属性系数;步骤3.2基于PageRank计算网页重要性的思想,对每一个人物实体进行PageRank值的计算;步骤3.3基于社交网络媒体挖掘的中心性方法,计算每一个人物实体进行中间中心性;步骤3.4基于社交网络媒体挖掘的中...

【专利技术属性】
技术研发人员:李弼程王瑞杜文倩郁友琴马海江
申请(专利权)人:华侨大学
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1