基于逻辑回归的实时识别异常关注的方法及系统技术方案

技术编号:26890993 阅读:36 留言:0更新日期:2020-12-29 16:08
本发明专利技术实施例提供一种基于逻辑回归的实时识别异常关注的方法及系统,包括:获取用户行为日志,将预设时间段内每个用户的所有行为特征形成各自相应的行为特征列表;根据每个用户的行为特征列表,周期性统计在前一预设时间段内的各用户相应的行为特征表征值并保存在数据库内;收到某一用户向其他用户发起的关注请求时,自数据库中获取该用户的最新行为特征表征值、该用户所要关注的其他用户的最新行为特征表征值;并利用预先训练的用户特征逻辑回归模型进行训练,返回逻辑回归训练结果;将逻辑回归训练结果与预设概率阈值进行比较,判断该用户向其他用户发起的关注是否为异常关注。有效的实时的判断当前关注行为是否为异常,降低对正常用户的干扰。

【技术实现步骤摘要】
基于逻辑回归的实时识别异常关注的方法及系统
本专利技术涉及互联网领域,具体涉及一种基于逻辑回归的实时识别异常关注的方法及系统。
技术介绍
在现代的社交媒体的互联网帐号中,以及在现代的社交媒体的互联网社交平台中,关注关系是一种非常重要的关系。于是出现大量不法分子利用脚本批量的刷关注,这些非法的关注行为称为异常关注。异常关注是对普通用户和对平台都不利的,要想办法找出来。在实现本专利技术过程中,申请人发现现有技术中至少存在如下问题:现有技术采用在客户端上做频次限制。比如,在客户端上每20秒统计一次这20秒的发起关注次数,如果大于5次则该用户接下来60秒内不能再发起关注。采用此种方法的的缺点为:如果不法分子账号很多,这一限制就无法找出。而且这一技术有可能会干扰正常用户的使用。最关键的是,不法分子如果不在客户端上发起请求则可以轻松避开这一限制。
技术实现思路
本专利技术实施例提供基于逻辑回归的实时识别异常关注的方法及系统,有效的实时的判断当前关注行为是否为异常,降低对正常用户的干扰。为达上述目的,一方面,本专利技术实施例提供一种基于逻辑回归的实时识别异常关注的方法,包括:获取用户行为日志,提取每个用户的行为特征,将预设时间段内每个用户的所有行为特征形成各自相应的行为特征列表;根据每个用户的行为特征列表,周期性统计在前一预设时间段内的各用户相应的行为特征表征值并保存在数据库内,所述用户的行为特征表征值包括:用户的固有周期行为特征在所有行为特征中的出现比率、用户占比最多的行为特征在所有行为特征中的占比、以及预设时间段内提出关注请求的次数;其中,所述固有周期行为特征是指由后台触发并向用户推送的行为特征;当收到某一用户向其他用户发起的关注请求时,自数据库中获取该用户的最新行为特征表征值、该用户所要关注的其他用户的最新行为特征表征值;利用预先训练的用户特征逻辑回归模型训练该用户的最新行为特征表征值、该用户所要关注的其他用户的最新行为特征表征值,返回逻辑回归训练结果,所述逻辑回归训练结果用于表征所述用户向其他用户发起的关注为异常关注的概率;将逻辑回归训练结果与预设概率阈值进行比较,判断该用户向其他用户发起的关注是否为异常关注。另一方面,本专利技术实施例提供一种基于逻辑回归的实时识别异常关注的系统,包括:行为提取单元,用于获取用户行为日志,提取每个用户的行为特征,将预设时间段内每个用户的所有行为特征形成各自相应的行为特征列表;表征值统计单元,用于根据每个用户的行为特征列表,周期性统计在前一预设时间段内的各用户相应的行为特征表征值并保存在数据库内,所述用户的行为特征表征值包括:用户的固有周期行为特征在所有行为特征中的出现比率、用户占比最多的行为特征在所有行为特征中的占比、以及预设时间段内提出关注请求的次数;其中,所述固有周期行为特征是指由后台触发并向用户推送的行为特征;实时训练单元,用于当收到某一用户向其他用户发起的关注请求时,自数据库中获取该用户的最新行为特征表征值、该用户所要关注的其他用户的最新行为特征表征值;利用预先训练的用户特征逻辑回归模型训练该用户的最新行为特征表征值、该用户所要关注的其他用户的最新行为特征表征值,返回逻辑回归训练结果,所述逻辑回归训练结果用于表征所述用户向其他用户发起的关注为异常关注的概率;结果判断单元,用于将逻辑回归训练结果与预设概率阈值进行比较,判断该用户向其他用户发起的关注是否为异常关注。上述技术方案具有如下有益效果:能有效的实时的判断当前关注行为是否为异常,降低对正常用户的干扰。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例的一种基于逻辑回归的实时识别异常关注的方法的流程图;图2是本专利技术实施例的一种基于逻辑回归的实时识别异常关注的系统的结构图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示,结合本专利技术的实施例,提供一种基于逻辑回归的实时识别异常关注的方法,包括:S101:获取用户行为日志,提取每个用户的行为特征,将预设时间段内每个用户的所有行为特征形成各自相应的行为特征列表;S102:根据每个用户的行为特征列表,周期性统计在前一预设时间段内的各用户相应的行为特征表征值并保存在数据库内,所述用户的行为特征表征值包括:用户的固有周期行为特征在所有行为特征中的出现比率、用户占比最多的行为特征在所有行为特征中的占比、以及预设时间段内提出关注请求的次数;其中,所述固有周期行为特征是指由后台触发并向用户推送的行为特征;S103:当收到某一用户向其他用户发起的关注请求时,自数据库中获取该用户的最新行为特征表征值、该用户所要关注的其他用户的最新行为特征表征值;利用预先训练的用户特征逻辑回归模型训练该用户的最新行为特征表征值、该用户所要关注的其他用户的最新行为特征表征值,返回逻辑回归训练结果,所述逻辑回归训练结果用于表征所述用户向其他用户发起的关注为异常关注的概率;S104:将逻辑回归训练结果与预设概率阈值进行比较,判断该用户向其他用户发起的关注是否为异常关注。优选地,步骤101具体包括:S1011:获取用户行为日志,自用户行为日志中提取与用户行为特征相关的信息,并将所提取的与用户行为特征相关的信息转化成数据格式;其中,所述与用户行为特征相关的信息包括:行为特征、行为特征发生时间、发生行为特征的用户的唯一账号名uid;S1012:针对每个用户,根据该用户的具有数据格式的与用户行为特征相关的信息提取该用户的行为特征,将提取出的行为特征形成相应用户的行为特征列表;所述用户的行为特征列表包括当前时间之前的预设时间段内的所有以数据格式体现的与用户行为特征相关的信息。优选地,还包括S105:训练用户特征逻辑回归模型;步骤105的所述用户特征逻辑回归模型的训练方法,具体包括:S1051:自数据库中获取一批样本用户在发起关注请求时的最新行为特征表征值、以及该批样本用户所要关注的其他用户的最新行为特征表征值;S1052:以关注请求为单位,将发起关注请求的样本用户的最新行为特征表征值与其所要关注的其他用户的最新行为特征表征值排序形成一个样本数据点;所述样本数据点相对应的关注的异常关注标记为已知量,如果是异常关注,则异常关注标记取值为1,如果是正常关注,则异常关注标记取值为0;S1053将每个样本数据点作为矩阵的行,形成数据点矩阵X;以及将每个样本数据点所对应的异常关注本文档来自技高网...

【技术保护点】
1.一种基于逻辑回归的实时识别异常关注的方法,其特征在于,包括:/n获取用户行为日志,提取每个用户的行为特征,将预设时间段内每个用户的所有行为特征形成各自相应的行为特征列表;/n根据每个用户的行为特征列表,周期性统计在前一预设时间段内的各用户相应的行为特征表征值并保存在数据库内,所述用户的行为特征表征值包括:用户的固有周期行为特征在所有行为特征中的出现比率、用户占比最多的行为特征在所有行为特征中的占比、以及预设时间段内提出关注请求的次数;其中,所述固有周期行为特征是指由后台触发并向用户推送的行为特征;/n当收到某一用户向其他用户发起的关注请求时,自数据库中获取该用户的最新行为特征表征值、该用户所要关注的其他用户的最新行为特征表征值;利用预先训练的用户特征逻辑回归模型训练该用户的最新行为特征表征值、该用户所要关注的其他用户的最新行为特征表征值,返回逻辑回归训练结果,所述逻辑回归训练结果用于表征所述用户向其他用户发起的关注为异常关注的概率;/n将逻辑回归训练结果与预设概率阈值进行比较,判断该用户向其他用户发起的关注是否为异常关注。/n

【技术特征摘要】
1.一种基于逻辑回归的实时识别异常关注的方法,其特征在于,包括:
获取用户行为日志,提取每个用户的行为特征,将预设时间段内每个用户的所有行为特征形成各自相应的行为特征列表;
根据每个用户的行为特征列表,周期性统计在前一预设时间段内的各用户相应的行为特征表征值并保存在数据库内,所述用户的行为特征表征值包括:用户的固有周期行为特征在所有行为特征中的出现比率、用户占比最多的行为特征在所有行为特征中的占比、以及预设时间段内提出关注请求的次数;其中,所述固有周期行为特征是指由后台触发并向用户推送的行为特征;
当收到某一用户向其他用户发起的关注请求时,自数据库中获取该用户的最新行为特征表征值、该用户所要关注的其他用户的最新行为特征表征值;利用预先训练的用户特征逻辑回归模型训练该用户的最新行为特征表征值、该用户所要关注的其他用户的最新行为特征表征值,返回逻辑回归训练结果,所述逻辑回归训练结果用于表征所述用户向其他用户发起的关注为异常关注的概率;
将逻辑回归训练结果与预设概率阈值进行比较,判断该用户向其他用户发起的关注是否为异常关注。


2.根据权利要求1所述的基于逻辑回归的实时识别异常关注的方法,其特征在于,所述获取用户行为日志,提取每个用户的行为特征,将预设时间段内每个用户的所有行为特征形成各自相应的行为特征列表,具体包括:
获取用户行为日志,自用户行为日志中提取与用户行为特征相关的信息,并将所提取的与用户行为特征相关的信息转化成数据格式;其中,所述与用户行为特征相关的信息包括:行为特征、行为特征发生时间、发生行为特征的用户的唯一账号名uid;
针对每个用户,根据该用户的具有数据格式的与用户行为特征相关的信息提取该用户的行为特征,将提取出的行为特征形成相应用户的行为特征列表;所述用户的行为特征列表包括当前时间之前的预设时间段内的所有以数据格式体现的与用户行为特征相关的信息。


3.根据权利要求1所述的基于逻辑回归的实时识别异常关注的方法,其特征在于,所述用户特征逻辑回归模型的训练方法,具体包括:
自数据库中获取一批样本用户在发起关注请求时的最新行为特征表征值、以及该批样本用户所要关注的其他用户的最新行为特征表征值;
以关注请求为单位,将发起关注请求的样本用户的最新行为特征表征值与其所要关注的其他用户的最新行为特征表征值排序形成一个样本数据点;所述样本数据点相对应的关注的异常关注标记为已知量,如果是异常关注,则异常关注标记取值为1,如果是正常关注,则异常关注标记取值为0;
将每个样本数据点作为矩阵的行,形成数据点矩阵X;以及将每个样本数据点所对应的异常关注标记作为行,形成向量Y;其中,每个样本数据点对应一个行向量,行向量的元素数量为该样本数据点包括的行为特征表征值的数量,异常关注标记在向量Y所在的行与其相应的样本数据点在数据点矩阵X所在的行相同;
利用逻辑回归训练数据点矩阵X、向量Y,得到用户特征逻辑回归模型。


4.根据权利要求3所述的基于逻辑回归的实时识别异常关注的方法,其特征在于,所述利用预先训练的用户特征逻辑回归模型训练该用户的最新行为特征表征值、该用户所要关注的其他用户的最新行为特征表征值,返回逻辑回归训练结果,具体包括:
将该用户的最新行为特征表征值与其所要关注的用户的最新行为特征表征值排序形成一个待识别数据点,该待识别数据点对应行向量X1,待识别数据点对应的行向量X1与数据点矩阵X中各行向量的元素数量相同;
利用用户特征逻辑回归模型训练该待识别数据点对应的行向量X1,得到逻辑回归训练结果Y1,其中,0≤Y1≤1。


5.根据权利要求4所述的基于逻辑回归的实时识别异常关注的方法,其特征在于,所述将逻辑回归结果与预设阈值进行比较以判断该用户向其他用户发起请求的关注是否为异常关注,具体包括:
当逻辑回归训练结果Y1大于预设概率阈值时,判定该用户向其他用户发起的关注为异常关注;
当逻辑回归训练结果Y1不大于预设概率阈值时,判定该用户向其他用户发起请求的关注为正常关注。

...

【专利技术属性】
技术研发人员:王嘉伟
申请(专利权)人:微梦创科网络科技中国有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1