水帖识别方法和装置制造方法及图纸

技术编号:17201022 阅读:70 留言:0更新日期:2018-02-04 02:11
本发明专利技术实施例提供一种水帖识别方法和装置,此方法包括:获取在社交网站中发布的网络帖子的相关属性信息;在所述网络帖子的相关属性信息满足预设水帖条件时,确定所述网络帖子为水帖;所述网络帖子的相关属性信息包括以下至少一种:发布所述网络帖子的用户的账号的属性信息、所述网络帖子的属性信息。因此,本实施例根据网络帖子的相关属性信息来识别水帖,无需对网络帖子的正文内容进行语义分析,避免了语义分析的复杂过程,而且本实施例中网络帖子的相关属性信息容易获得,因此水帖识别速度较快,提高了水帖识别效率。

【技术实现步骤摘要】
水帖识别方法和装置
本专利技术实施例涉及数据处理
,尤其涉及一种水帖识别方法和装置。
技术介绍
随着社交网站的飞速发展,商家越来越关注自身或竞品的舆情口碑,活动效果等信息。微博作为最开放的主要社交网站,是商家主要的分析平台。然而由于水军泛滥,造成大量的无效低质数据,造成统计数据与实际情况偏差,产生错误的判断,对商家分析结果产生影响。因此,分析社交网站中发布的网络帖子是否为水帖至关重要。现有技术中,识别发布的网络帖子是否为水帖的方法是,对发布的网络帖子的正文进行语义分析,再根据语义分析获得的结果,判断该网络帖子是否为水帖。但是上述方式中,语义分析过程复杂,并且速度较慢,从而造成网络帖子的水帖识别效率低下。
技术实现思路
本专利技术实施例提供一种水帖识别方法和装置,用于提高水帖识别效率。第一方面,本专利技术实施例提供一种水帖识别方法,包括:获取在社交网站中发布的网络帖子的相关属性信息;在所述网络帖子的相关属性信息满足预设水帖条件时,确定所述网络帖子为水帖;所述网络帖子的相关属性信息包括以下至少一种:发布所述网络帖子的用户的账号的属性信息、所述网络帖子的属性信息。在一种可能的设计中,当所述账号的属性信息包括:所述账号在所述社交网站中的创建时间到当前时间内的平均预设时间段的活跃数据、所述账号的互粉数据、所述账号是否位于水军账号黑名单中时;所述在所述网络帖子的相关属性信息满足预设水帖条件时,确定所述网络帖子为水帖,包括:在存在以下至少一种情况时:所述活跃数据大于第一预设值、所述账号的互粉数据小于第二预设值、所述账号位于水军账号黑名单中,确定所述网络帖子为水帖。在一种可能的设计中,所述活跃数据为发帖量;所述互粉数据包括:关注所述账号且被所述账号关注的用户的数量。在一种可能的设计中,当所述网络帖子的属性信息包括:所述网络帖子的互动数据、话题内容占所述网络帖子的全文中的比例、所述网络帖子当前是否已被删除时;所述在所述网络帖子的相关属性信息满足预设水帖条件时,确定所述网络帖子为水帖,包括:在存在以下至少一种情况时:所述互动数据小于第三预设值、所述比例大于第四预设值、所述网络帖子当前已被删除,确定所述网络帖子为水帖。在一种可能的设计中,所述互动数据包括:所述网络帖子的转发数、评论数、点赞数之和。第二方面,本专利技术实施例提供一种水帖识别装置,包括:获取模块,用于获取在社交网站中发布的网络帖子的相关属性信息;确定模块,用于在所述网络帖子的相关属性信息满足预设水帖条件时,确定所述网络帖子为水帖;所述网络帖子的相关属性信息包括以下至少一种:发布所述网络帖子的用户的账号的属性信息、所述网络帖子的属性信息。在一种可能的设计中,当所述账号的属性信息包括:所述账号在所述社交网站中的创建时间到当前时间内的平均预设时间段的活跃数据、所述账号的互粉数据、所述账号是否位于水军账号黑名单中时;所述确定模块,具体用于:在存在以下至少一种情况时:所述活跃数据大于第一预设值、所述账号的互粉数据小于第二预设值、所述账号位于水军账号黑名单中,确定所述网络帖子为水帖。在一种可能的设计中,所述活跃数据为发帖量;所述互粉数据包括:关注所述账号且被所述账号关注的用户的数量。在一种可能的设计中,当所述网络帖子的属性信息包括:所述网络帖子的互动数据、话题内容占所述网络帖子的全文中的比例、所述网络帖子当前是否已被删除时;所述确定模块,具体用于:在存在以下至少一种情况时:所述互动数据小于第三预设值、所述比例大于第四预设值、所述网络帖子当前已被删除,确定所述网络帖子为水帖。在一种可能的设计中,所述互动数据包括:所述网络帖子的转发数、评论数、点赞数之和。第三方面,本专利技术实施例提供一种水帖识别装置,包括:存储器、处理器以及计算机程序,所述处理器运行所述计算机程序执行如第一方面本专利技术实施例所述的水帖识别方法。第四方面,本专利技术实施例提供一种存储介质,包括:可读存储介质和计算机程序,所述计算机程序用于实现如第一方面本专利技术实施例所述的水帖识别方法。第五方面,本专利技术实施例提供一种程序产品,所述程序产品包括计算机程序,所述计算机程序存储在可读存储介质中,水帖识别装置的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得水帖识别装置实施如第一方面本专利技术实施例所述的水帖识别方法。本专利技术实施例提供一种水帖识别方法和装置,通过获取在社交网站中发布的网络帖子的相关属性信息,所述网络帖子的相关属性信息包括以下至少一种:发布所述网络帖子的用户的账号的属性信息、所述网络帖子的属性信息,然后在所述网络帖子的相关属性信息满足预设水帖条件时,确定所述网络帖子为水帖。因此,本实施例根据网络帖子的相关属性信息来识别水帖,无需对网络帖子的正文内容进行语义分析,避免了语义分析的复杂过程,而且本实施例中网络帖子的相关属性信息容易获得,因此水帖识别速度较快,提高了水帖识别效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例提供的水帖识别方法的流程图;图2为本专利技术另一实施例提供的水帖识别方法的流程图;图3为本专利技术另一实施例提供的水帖识别方法的流程图;图4为本专利技术另一实施例提供的水帖识别方法的流程图;图5为本专利技术一实施例提供的水帖识别装置的结构示意图;图6为本专利技术另一实施例提供的水帖识别装置的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1为本专利技术一实施例提供的水帖识别方法的流程图,如图1所示,本实施例的方法可以应用于电子设备中,该电子设备可以是终端(例如手机、平板电脑、台式电脑、笔记本电脑)也可以是服务器。本实施例的方法可以包括:S101、获取在社交网站中发布的网络帖子的相关属性信息。本实施例中的网络帖子是指在社交网络中发布的帖子,该社交网络可以是网络贴吧,该网络帖子可以是指在网络帖吧中发布的帖子;或者,该社交网络可以是微博,该网络帖子可以是指在微博中发布的微博消息;或者,该社交网络可以是微信的朋友圈,该网络帖子可以是指发布在朋友圈中的消息;或者,该社交网络可以是QQ,该网络帖子可以是指发布在QQ中的说说。此处是举例说明,本实施例并不限于此。在一个网络帖子在社交网络发布后,本实施例可以获取到该网络帖子的相关属性信息,需要说明的是,该相关属性信息并不是该网络帖子的全文内容信息。其中,该网络帖子的相关属性信息为该发布该网络帖子的用户的账号的属性信息,该用户的账号可以是指用户登陆该社交网络所使用的账号。或者,该网络帖子的相关属性信息为该网络帖子的属性信息。或者,该网络帖子的相关属性信息为该发布该网络帖子的用户的账号的属性信息以及该网络帖子的属性信息。S102、在所述网络帖子的本文档来自技高网...
水帖识别方法和装置

【技术保护点】
一种水帖识别方法,其特征在于,包括:获取在社交网站中发布的网络帖子的相关属性信息;在所述网络帖子的相关属性信息满足预设水帖条件时,确定所述网络帖子为水帖;所述网络帖子的相关属性信息包括以下至少一种:发布所述网络帖子的用户的账号的属性信息、所述网络帖子的属性信息。

【技术特征摘要】
1.一种水帖识别方法,其特征在于,包括:获取在社交网站中发布的网络帖子的相关属性信息;在所述网络帖子的相关属性信息满足预设水帖条件时,确定所述网络帖子为水帖;所述网络帖子的相关属性信息包括以下至少一种:发布所述网络帖子的用户的账号的属性信息、所述网络帖子的属性信息。2.根据权利要求1所述的方法,其特征在于,当所述账号的属性信息包括:所述账号在所述社交网站中的创建时间到当前时间内的平均预设时间段的活跃数据、所述账号的互粉数据、所述账号是否位于水军账号黑名单中时;所述在所述网络帖子的相关属性信息满足预设水帖条件时,确定所述网络帖子为水帖,包括:在存在以下至少一种情况时:所述活跃数据大于第一预设值、所述账号的互粉数据小于第二预设值、所述账号位于水军账号黑名单中,确定所述网络帖子为水帖。3.根据权利要求2所述的方法,其特征在于,所述活跃数据为发帖量;所述互粉数据包括:关注所述账号且被所述账号关注的用户的数量。4.根据权利要求1所述的方法,其特征在于,当所述网络帖子的属性信息包括:所述网络帖子的互动数据、话题内容占所述网络帖子的全文中的比例、所述网络帖子当前是否已被删除时;所述在所述网络帖子的相关属性信息满足预设水帖条件时,确定所述网络帖子为水帖,包括:在存在以下至少一种情况时:所述互动数据小于第三预设值、所述比例大于第四预设值、所述网络帖子当前已被删除,确定所述网络帖子为水帖。5.根据权利要求4所述的方法,其特征在于,所述互动数据包括:所述网络帖子的转发数、评论数、点赞数之和。6.一种水帖识别装置,其特征在于,包括:获取模块,用于获取在社交网站中发布的网络帖子的相关属性信息;确定模块,用于在所述网络帖子的相关属性信息满足预设水帖条件时,确定所述网络帖子为水帖;所...

【专利技术属性】
技术研发人员:冯允
申请(专利权)人:精硕科技北京股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1