水帖识别方法和装置制造方法及图纸

技术编号:17201022 阅读:82 留言:0更新日期:2018-02-04 02:11
本发明专利技术实施例提供一种水帖识别方法和装置,此方法包括:获取在社交网站中发布的网络帖子的相关属性信息;在所述网络帖子的相关属性信息满足预设水帖条件时,确定所述网络帖子为水帖;所述网络帖子的相关属性信息包括以下至少一种:发布所述网络帖子的用户的账号的属性信息、所述网络帖子的属性信息。因此,本实施例根据网络帖子的相关属性信息来识别水帖,无需对网络帖子的正文内容进行语义分析,避免了语义分析的复杂过程,而且本实施例中网络帖子的相关属性信息容易获得,因此水帖识别速度较快,提高了水帖识别效率。

【技术实现步骤摘要】
水帖识别方法和装置
本专利技术实施例涉及数据处理
,尤其涉及一种水帖识别方法和装置。
技术介绍
随着社交网站的飞速发展,商家越来越关注自身或竞品的舆情口碑,活动效果等信息。微博作为最开放的主要社交网站,是商家主要的分析平台。然而由于水军泛滥,造成大量的无效低质数据,造成统计数据与实际情况偏差,产生错误的判断,对商家分析结果产生影响。因此,分析社交网站中发布的网络帖子是否为水帖至关重要。现有技术中,识别发布的网络帖子是否为水帖的方法是,对发布的网络帖子的正文进行语义分析,再根据语义分析获得的结果,判断该网络帖子是否为水帖。但是上述方式中,语义分析过程复杂,并且速度较慢,从而造成网络帖子的水帖识别效率低下。
技术实现思路
本专利技术实施例提供一种水帖识别方法和装置,用于提高水帖识别效率。第一方面,本专利技术实施例提供一种水帖识别方法,包括:获取在社交网站中发布的网络帖子的相关属性信息;在所述网络帖子的相关属性信息满足预设水帖条件时,确定所述网络帖子为水帖;所述网络帖子的相关属性信息包括以下至少一种:发布所述网络帖子的用户的账号的属性信息、所述网络帖子的属性信息。在一种可能的设计中,当所本文档来自技高网...
水帖识别方法和装置

【技术保护点】
一种水帖识别方法,其特征在于,包括:获取在社交网站中发布的网络帖子的相关属性信息;在所述网络帖子的相关属性信息满足预设水帖条件时,确定所述网络帖子为水帖;所述网络帖子的相关属性信息包括以下至少一种:发布所述网络帖子的用户的账号的属性信息、所述网络帖子的属性信息。

【技术特征摘要】
1.一种水帖识别方法,其特征在于,包括:获取在社交网站中发布的网络帖子的相关属性信息;在所述网络帖子的相关属性信息满足预设水帖条件时,确定所述网络帖子为水帖;所述网络帖子的相关属性信息包括以下至少一种:发布所述网络帖子的用户的账号的属性信息、所述网络帖子的属性信息。2.根据权利要求1所述的方法,其特征在于,当所述账号的属性信息包括:所述账号在所述社交网站中的创建时间到当前时间内的平均预设时间段的活跃数据、所述账号的互粉数据、所述账号是否位于水军账号黑名单中时;所述在所述网络帖子的相关属性信息满足预设水帖条件时,确定所述网络帖子为水帖,包括:在存在以下至少一种情况时:所述活跃数据大于第一预设值、所述账号的互粉数据小于第二预设值、所述账号位于水军账号黑名单中,确定所述网络帖子为水帖。3.根据权利要求2所述的方法,其特征在于,所述活跃数据为发帖量;所述互粉数据包括:关注所述账号且被所述账号关注的用户的数量。4.根据权利要求1所述的方法,其特征在于,当所述网络帖子的属性信息包括:所述网络帖子的互动数据、话题内容占所述网络帖子的全文中的比例、所述网络帖子当前是否已被删除时;所述在所述网络帖子的相关属性信息满足预设水帖条件时,确定所述网络帖子为水帖,包括:在存在以下至少一种情况时:所述互动数据小于第三预设值、所述比例大于第四预设值、所述网络帖子当前已被删除,确定所述网络帖子为水帖。5.根据权利要求4所述的方法,其特征在于,所述互动数据包括:所述网络帖子的转发数、评论数、点赞数之和。6.一种水帖识别装置,其特征在于,包括:获取模块,用于获取在社交网站中发布的网络帖子的相关属性信息;确定模块,用于在所述网络帖子的相关属性信息满足预设水帖条件时,确定所述网络帖子为水帖;所...

【专利技术属性】
技术研发人员:冯允
申请(专利权)人:精硕科技北京股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1