【技术实现步骤摘要】
一种由不实信息驱动的社交网络主题专家查找方法
本专利技术属于信息检索领域,更具体地,涉及一种由不实信息驱动的社交网络主题专家查找方法。
技术介绍
随着互联网技术尤其是Web2.0技术以及无线通信技术的不断发展,我国互联网用户人群急剧增长,根据中国互联网络信息中心(CNNIC)发布的第39次《中国互联网络发展状况》统计报告显示,截至2016年12月,中国互联网普及率达到53.2%,网民规模达7.31亿,相当于整个欧洲人口总量。海量互联网用户促进了各种社交应用的蓬勃发展,如微博社交网络(Twitter、新浪微博等)。截至2016年8月,新浪微博月活跃用户为2.82亿,连续九个季度保持30%以上的增长,其中移动端月活用户同比增长40%。新浪微博作为中国社交网络最具代表性的应用之一,在移动互联网蓬勃发展的背景下也迅速成长,截至2016年8月,新浪微博月活跃用户为2.82亿,连续九个季度保持30%以上的增长,其中移动端月活用户同比增长40%。然而,高速发展的微博平台同样为谣言传播提供了环境,针对微博中可疑信息甄别问题已在社会学范畴被广泛研究,其能够有效帮助微博管理者实时准确 ...
【技术保护点】
1.一种由不实信息驱动的社交网络主题专家查找方法,其特征在于,包括:(1)利用社交网络数据集,构建候选用户文档,利用候选用户文档和待查询不实信息,构建概率图模型;(2)利用候选用户文档和待查询不实信息训练概率图模型,当概率图模型的参数收敛后,得到维度相同的候选用户向量和待查询不实信息向量;(3)通过计算候选用户向量和待查询不实信息向量的余弦距离,得到候选用户和待查询不实信息的相似度,利用相似度得到查询结果。
【技术特征摘要】
1.一种由不实信息驱动的社交网络主题专家查找方法,其特征在于,包括:(1)利用社交网络数据集,构建候选用户文档,利用候选用户文档和待查询不实信息,构建概率图模型;(2)利用候选用户文档和待查询不实信息训练概率图模型,当概率图模型的参数收敛后,得到维度相同的候选用户向量和待查询不实信息向量;(3)通过计算候选用户向量和待查询不实信息向量的余弦距离,得到候选用户和待查询不实信息的相似度,利用相似度得到查询结果。2.如权利要求1所述的一种由不实信息驱动的社交网络主题专家查找方法,其特征在于,所述步骤(1)包括:(1-1)从社交网络数据集中获取用户自我简介信息和包含用户的列表信息,提取用户自我简介信息和包含用户的列表信息的动词和名词,构建D个候选用户文档;(1-2)每个候选用户文档包含K个主题,K个主题满足多项分布,对于K个主题中的每个单词,生成单词的主题分布样本,并假定每个主题均有概率得到每个单词,此概率满足多项分布;(1-3)根据查询社交网络数据集中任意2个候选用户文档是否在同一个列表中,得到列表共现信息,利用概率、列表共现信息结合待查询不实信息,构建概率图模型。3.如权利要求1或2所述的一种由不实信...
【专利技术属性】
技术研发人员:李国徽,董明,周全,李剑军,
申请(专利权)人:华中科技大学,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。