The invention discloses a method and device for processing information released by a network social platform. The method includes: after the target information is published on the network social platform, the operation information is obtained by the user through the network social platform. At least, the target information is evaluated according to the operation information, and the evaluation value of the reference basis for evaluating the target information is obtained. The invention solves the technical problem that the high quality data needed for public opinion analysis can not be selected from mass Internet information in related technologies.
【技术实现步骤摘要】
处理网络社交平台发布的信息的方法及装置
本专利技术涉及信息处理领域,具体而言,涉及一种处理网络社交平台发布的信息的方法及装置。
技术介绍
目前,随着互联网的飞速发展,越来越多的媒体信息出现在网络上,为舆情分析提供了海量文本信息,例如,通过提取并利用文本信息,政府可以了解民意,企业可以了解顾客的兴趣和感受,等等。然而,在目前的自然语言处理技术(NaturalLanguageProcessing,简称为NLP)发展水平下,对任何企业和个人而言,通过如此海量的文本信息进行舆情分析,都会面临着巨大挑战。以微博为例,每天大约会发布7500万条微博,微博数据已然成为互联网舆情数据的重要组成部分,广大网民可以通过微博自由地表达自己的想法和意见。目前,面对过量的微博数据,进行舆情分析时,通常采取随机采样的方式,通过选取部分微博数据进行处理,并根据处理结果进行放大处理,以模拟全部微博数据。该方法依赖采样效果,缺乏对微博内容质量的考虑。例如,通过选取微博数据时,并没有考虑到人群对微博信息的阅读以及传播习惯,在这种情况下,很有可能会忽略掉部分关键信息,同时不可避免地会爬取到一些“僵尸” ...
【技术保护点】
一种处理网络社交平台发布的信息的方法,其特征在于,包括:在网络社交平台发布目标信息后,获取用户通过所述网络社交平台对所述目标信息进行操作的操作信息;至少根据所述操作信息对所述目标信息进行评估,得到用于作为评估所述目标信息的参考依据的评估值。
【技术特征摘要】
1.一种处理网络社交平台发布的信息的方法,其特征在于,包括:在网络社交平台发布目标信息后,获取用户通过所述网络社交平台对所述目标信息进行操作的操作信息;至少根据所述操作信息对所述目标信息进行评估,得到用于作为评估所述目标信息的参考依据的评估值。2.根据权利要求1所述的方法,其特征在于,在网络社交平台发布目标信息后,获取用户通过所述网络社交平台对所述目标信息进行操作的操作信息,并至少根据所述操作信息对所述目标信息进行评估,得到用于作为评估所述目标信息的参考依据的评估值包括:在所述网络社交平台发布所述目标信息后,获取所述目标信息;确定发布所述目标信息所使用的网络社交账号的认证类型;和/或确定所述目标信息在发布后的阅读量,以及读者阅读所述目标信息后产生的操作参数;根据所述认证类型、和/或所述阅读量及所述操作参数,确定用于评估所述目标信息的参考依据的评估值。3.根据权利要求2所述的方法,其特征在于,所述操作参数包括以下至少之一:点赞量、评论量、转发量,其中,根据所述认证类型、所述阅读量和所述操作参数,通过以下公式确定用于评估所述目标信息的参考依据的评估值:Ri=Vi*(a*Ai+b*Bi+c*Ci+d*Di),其中,Ri表示第i条信息的重要性的评估值,Vi表示发布第i条信息所使用的社交账号的认证类型对应权重值,Ai表示第i条信息的阅读量,a表示阅读量所对应的权重值,Bi表示第i条信息的点赞量,表示点赞量所对应的权重值,Ci表示第i条信息的评论量,c表示评论量所对应的权重值,Di表示第i条信息的转发量,d表示转发量所对应的权重值。4.根据权利要求2所述的方法,其特征在于,在确定用于评估所述目标信息的参考依据的评估值之后,所述方法还包括:判断所述评估值是否大于预设评估值;若是,则将所述目标信息作为反映网民的舆情表达的舆情信息。5.根据权利要求4所述的方法,其特征在于,在将所述目标信息作为反映网民的舆情表达的舆情信息之后,所述方法还包括:收集所述舆情信息;根据收集的舆情信息分析网民的舆情表达。6.根据权利要求2至5中任一项所...
【专利技术属性】
技术研发人员:贺达,
申请(专利权)人:北京国双科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。