The embodiment of the invention provides a method and system for identifying network users, a shielding method and a system for network information, belonging to the technical field of network information identification. This method includes: acquiring the target user set; acquiring the historical text information published by each target user; using LDA topic model to analyze the historical text information and determine the domain of expertise of each target user; determining the similarity of each two target users in the target user set according to the domain of expertise to construct the similarity matrix; acquiring the number of fans and the number of answers from the target user. Quantity and number of praises are used to calculate the node attribute eigenvalues of the target user; the relationship between the two target users in the target user set is obtained to construct the concern matrix; the transfer probability matrix of the target user is constructed according to the domain of expertise, the similarity matrix and the concern matrix, and each target is obtained by PageRank algorithm according to the node attribute eigenvalues and the transfer probability matrix. Household ratings.
【技术实现步骤摘要】
鉴定网络用户的方法及系统、网络信息的屏蔽方法及系统
本专利技术涉及网络信息的识别
,具体地涉及一种鉴定网络用户的方法及系统、网络信息的屏蔽方法及系统。
技术介绍
随着Quora、知乎等网络问答社区逐渐渗入大众的生活,社区用户可以在社区中自由提问、评论、转发、点赞,表达自己的观点。与百度知道、Yahoo!Answers等传统问答社区不同,社会化问答社区更注重进行多元信息交互。随着大量用户生成内容涌现,社区中问题与答案数量累积,社区中出现问答质量良莠不齐,问题无法得到专家即时解答等现象。如何识别社会化网络问答社区中的专家特征,发现可以提供优质答案的专家,也逐渐成为学术界的研究热点。
技术实现思路
本专利技术实施方式的目的是提供一种鉴定网络用户的方法及系统、网络信息的屏蔽方法及系统,鉴定网络用户的方法及系统可以对每个网络用户进行评分,屏蔽方法和系统可以屏蔽评分较低的网络用户的信息,从而提高网络问答的效率和准确度。为了实现上述目的,本专利技术实施方式提供一种鉴定网络用户的方法,所述方法包括:获取目标用户集合;获取所述目标用户集合中每个所述目标用户发布的历史文本信息;采用 ...
【技术保护点】
1.一种鉴定网络用户的方法,其特征在于,所述方法包括:获取目标用户集合;获取所述目标用户集合中每个所述目标用户发布的历史文本信息;采用LDA主题模型对所述历史文本信息进行分析,确定每个所述目标用户的专长领域;根据每个目标用户的专长领域确定所述目标用户集合中每两个所述目标用户的相似度以构建相似度矩阵;获取所述目标用户的粉丝数量、回答数量和获赞数量以计算所述目标用户的节点属性特征值;获取所述目标用户集合中每两个所述目标用户之间的关注关系以构建关注矩阵;根据所述专长领域、所述相似度矩阵、以及所述关注矩阵构建所述目标用户的转移概率矩阵,采用PageRank算法根据所述节点属性特征值 ...
【技术特征摘要】
1.一种鉴定网络用户的方法,其特征在于,所述方法包括:获取目标用户集合;获取所述目标用户集合中每个所述目标用户发布的历史文本信息;采用LDA主题模型对所述历史文本信息进行分析,确定每个所述目标用户的专长领域;根据每个目标用户的专长领域确定所述目标用户集合中每两个所述目标用户的相似度以构建相似度矩阵;获取所述目标用户的粉丝数量、回答数量和获赞数量以计算所述目标用户的节点属性特征值;获取所述目标用户集合中每两个所述目标用户之间的关注关系以构建关注矩阵;根据所述专长领域、所述相似度矩阵、以及所述关注矩阵构建所述目标用户的转移概率矩阵,采用PageRank算法根据所述节点属性特征值与所述转移概率矩阵获取每个所述目标用户的评分。2.根据权利要求1所述的方法,其特征在于,所述采用LDA主题模型对所述历史文本信息进行分析,确定每个所述目标用户的专长领域包括:将所述历史文本信息转化为目标用户与主题以及主题与词语的概率分布;根据所述概率分布确定所述目标用户的专长领域。3.根据权利要求1所述的方法,其特征在于,所述根据每个目标用户集合的专长领域确定所述目标用户集合中每两个所述目标用户的相似度以构建相似度矩阵包括:根据公式(1)计算每两个所述目标用户的相似度,其中,uit为所述目标用户ui专长领域的分布的值,ujt为所述目标用户uj专长领域的分布的值,Sij为所述相似度,k为目标用户ui及目标用户uj的专长领域的值的总数。4.根据权利要求1所述的方法,其特征在于,所述获取所述目标用户的粉丝数量、回答数量和获赞数量,对所述粉丝数量、所述回答数量和所述获赞数量以计算所述目标用户的节点属性特征值包括:对所述粉丝数量、所述回答数量和所述获赞数量进行归一化处理。5.根据权利要求3所述的方法,其特征在于,所述归一化处理包括:采用公式(2)处理所述粉丝数量、所述回答数量和所述获赞数量,其中,f(...
【专利技术属性】
技术研发人员:余本功,曹雨蒙,杨颖,范招娣,张宏梅,朱梦迪,王胡燕,汲浩敏,
申请(专利权)人:合肥工业大学,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。