一种用户识别方法和系统技术方案

技术编号:21301946 阅读:27 留言:0更新日期:2019-06-12 08:32
本发明专利技术涉及用户识别方法和系统。所述用户识别方法包括:收集用户在使用应用时的用户数据;对收集到的用户数据进行预处理,生成由多个特征组成的用户信息;以及根据所述用户信息,利用机器学习模型,确定用户的可疑程度;其中所述用户的可疑程度至少部分基于当前用户数据之间及其和历史对应数据之间的关联和/或用户行为模式稀有性的增加。所述用户识别系统包括:应用接口;用于接收客户端的用户数据或用户信息;和计算核心;计算核心经配置以利用用户数据或用户信息,利用机器学习模型,确定用户的可疑程度。本发明专利技术可洞察可疑的用户及其作弊状态,及时预警,也可以结合业务手段和策略,对作弊用户进行相应的处理,从而保护守法用户的正当权益,减少应用平台的损失。

A User Recognition Method and System

The invention relates to a user identification method and system. The user identification method includes: collecting user data when the user is using the application; preprocessing the collected user data to generate user information composed of multiple features; and using machine learning model to determine the suspicious degree of the user according to the user information; the suspicious degree of the user is at least partially based on the current user data and their calendar. History corresponds to the increase in association between data and/or the rarity of user behavior patterns. The user identification system includes: application interface; user data or user information for receiving clients; and computing core; computing core is configured to use user data or user information, and machine learning model to determine the suspicious degree of users. The invention can penetrate suspicious users and their cheating status, timely warning, and also can deal with the cheating users according to business means and strategies, thereby protecting the legitimate rights and interests of law-abiding users and reducing the loss of application platform.

【技术实现步骤摘要】
一种用户识别方法和系统
本专利技术涉及一种网络应用技术领或,特别地涉及一种用户识别方法和系统。
技术介绍
随着网络应用,尤其是各类移动应用的发展,各类应用为人们提供了越来越便利的生活。然而,目前在网络社交媒体应用中频繁出现的水军、为了获取应用提供的优惠而出现的欺骗行为,,从用户的角度来说,影响了真正用户应获取的优惠和利益;从应用提供者的角度而言,既被恶意用户套取了利益,也没有达到鼓励用户提高应用使用率的目的。因而,对于这些恶意用户的识别成为了目前网络应用领域中的一项难题。
技术实现思路
针对现有技术中存在的技术问题,本专利技术提出了一种用户识别方法和系统,用于识别当前各类应用的恶意用户。为解决上述技术问题,本专利技术提供了一种用户识别方法,其中包括:收集用户在使用应用时的用户数据;对收集到的用户数据进行预处理,生成由多个特征组成的用户信息;以及根据所述用户信息,利用机器学习模型,确定用户的可疑程度;其中所述用户的可疑程度至少部分基于当前用户数据之间及其和历史对应数据之间的关联和/或用户行为模式稀有性的增加。优选地,所述用户数据包括以下中的一者或多者:用户的个人信息;用户行为和行为时间;用户行为来源以及数字指纹;用户行为产生的数据;用户业务数据;以及与用户账户相关联的帐户信息。优选地,所述用户数据进行预处理包括:将收集到的用户数据进行格式和/或类型的转化;将转化后的用户数据进行特征分割、合并和/或重组,获得多个特征值;以及将所述多个特征值写入用户信息中对应的多个特征字段。优选地,所述特征为用户设备特征、用户行为特征和用户业务特征中的一种或多种。优选地,所述机器学习模型包括以下中的一者或者多者的联用或组合:分类机器学习模型;回归机器学习模型;以及无监督机器学习模型。优选地,确定用户的可疑程度包括确定用户可疑程度的评分分数。优选地,所述的方法进一步地包括:利用机器学习模型根据多个用户的用户信息,将用户分组为一个或多个用户群组;获得所述一个或多个用户群组的共性参数及其值。优选地,所述的方法进一步包括:根据一个或多个用户群组的共性参数及其值确定对应的用户群组是否为可疑用户群组。优选地,其中用户数据之间的关联包括用户设备之间的关联,所述用户设备之间的关联包括以下的一者或多者:多个用户设备属于同一用户;多个用户设备属于与同一用户有关联的多个用户;以及多个用户设备属于与多个用户有关联的多个用户。优选地,其中用户行为模式稀有性的增加包括以下的一者或多者:识别出批量用户的稀有性行为模式;行为模式稀有性增加超过预定的阈值;行为模式稀有性增加的时间段小于预定时间段;以及行为模式稀有性增加与一个用户或多个关联用户有关。为解决上述技术问题,本专利技术还提供了一种客户端设备,包括:显示器,用于向用户提供应用操作界面;通信单元;以及处理器,其与显示器和通信单元连接;其中,所述处理器经配置包括:埋点数据采集单元,经配置用以采集页面埋点获得用户数据;和系统广播监控单元,经配置用以采用第三方SDK监控用户设备的系统广播消息以获得用户数据;所述通信单元经配置以将收集到的用户数据提供给服务端。优选地,所述处理器经进一步配置,以将收集到的用户数据进行预处理,生成由多个特征组成的用户信息,并通过所述通信单元将所述用户信息提供给服务端。优选地,所述处理器经进一步配置,包括:格式转化单元,经配置用以将收集到的用户数据进行格式和/或类型的转化;特征值获取单元,经配置用以将转化后的用户数据进行特征分割、合并或重组,获得多个与预定规则中的特征对应的特征值;以及用户信息生成单元,经配置用以将所述特征值写入用户信息中对应的特征字段,以生成所述用户的用户信息。为解决上述技术问题,本专利技术还提供了一种用户识别系统,其中包括:应用接口;用于接收客户端的用户数据或用户信息;计算核心,其与应用接口连接;其中,计算核心经配置以利用用户数据或用户信息,利用机器学习模型,确定用户的可疑程度;其中所述用户的可疑程度至少部分基于当前用户数据之间及其与历史对应数据之间的关联和/或用户行为模式稀有性的增加。优选地,所述计算核心进一步包括:用户分析模块,经配置以将从应用接口接收到的用户数据进行预处理,生成由多个特征组成的用户信息;以及机器学习引擎,经配置用以根据所述用户信息,利用机器学习模型,确定用户的可疑程度。优选地,所述计算核心进一步包括:数据请求模块,经配置用以从应用服务器和/或用户数据库获取对应用户的业务数据和/或历史数据,并提供给所述用户分析模块。优选地,所述机器学习引擎进一步配置为,按照训练好的机器学习模型为用户评分,并输出所述用户可疑程度的评分分数。优选地,所述机器学习引擎进一步配置为根据多个用户的用户信息,按照相应的机器学习模型将用户分组为一个或多个用户群组;获得所述一个或多个用户群组的共性参数及其值。优选地,所述机器学习引擎进一步配置为根据一个或多个用户群组的共性参数及其值确定对应的用户群组是否为可疑用户群组。利用可视化监控平台,通过本系统和方法可洞察可疑的用户及其作弊状态,及时预警,也可以结合业务手段和策略,对作弊用户进行相应的处理,从而保护守法用户的正当权益,减少应用平台的损失。附图说明下面,将结合附图对本专利技术的优选实施方式进行进一步详细的说明,其中:图1是根据本专利技术的一个实施例的应用环境示意图;图2是根据本专利技术的一个实施例的识别系统的服务器的示意图;图3是根据本专利技术的一个实施例的客户端设备的示意图;图4是根据本专利技术的一个实施例的用户识别系统的示意图;图5是根据本专利技术的一个实施例的客户端处理器的示意图;图6是根据本专利技术一个实施例的用户识别方法流程图;以及图7是根据本专利技术另一个实施例的用户识别方法流程图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。在以下的详细描述中,可以参看作为本申请一部分用来说明本申请的特定实施例的各个说明书附图。在附图中,相似的附图标记在不同图式中描述大体上类似的组件。本申请的各个特定实施例在以下进行了足够详细的描述,使得具备本领域相关知识和技术的普通技术人员能够实施本申请的技术方案。应当理解,还可以利用其它实施例或者对本申请的实施例进行结构、逻辑或者电性的改变。本专利技术提供了一种用于识别应用(Application)恶意用户的系统和方法,其中,如图1所示,图1是根据本专利技术的一个实施例的应用环境示意图。如图所示,本专利技术的应用环境包括一个或多个在通信网络上的客户端设备102、应用服务器104(其可为一个服务器集群,其中包括业务服务器,用于为应用提供内容等业务方面的管理。)、网页服务器106、服务器负载平衡器108、云负载平衡器110。应用服务器104、网页服务器106、服务器负载平衡器108、云负载平衡器110通信地耦合到一个或多个数据库112。通信网络能够是覆盖行政区、国家、大陆或其组合的任意多级网络。通信网络的示例能够包括:蜂窝网络,诸如3G网络、4G网络、长期演进(LTE)网络;声波本文档来自技高网...

【技术保护点】
1.一种可疑用户识别方法,其中包括:收集用户在使用应用时的用户数据;对收集到的用户数据进行预处理,生成由多个特征组成的用户信息;以及根据所述用户信息,利用机器学习模型,确定用户的可疑程度;其中所述用户的可疑程度至少部分基于当前用户数据之间及其和历史对应数据之间的关联和/或用户行为模式稀有性的增加。

【技术特征摘要】
1.一种可疑用户识别方法,其中包括:收集用户在使用应用时的用户数据;对收集到的用户数据进行预处理,生成由多个特征组成的用户信息;以及根据所述用户信息,利用机器学习模型,确定用户的可疑程度;其中所述用户的可疑程度至少部分基于当前用户数据之间及其和历史对应数据之间的关联和/或用户行为模式稀有性的增加。2.根据权利要求1所述的方法,其中所述用户数据包括以下中的一者或多者:用户的个人信息;用户行为和行为时间;用户行为来源以及数字指纹;用户行为产生的数据;用户业务数据;以及与用户账户相关联的帐户信息。3.根据权利要求1所述的方法,其中所述用户数据进行预处理包括:将收集到的用户数据进行格式和/或类型的转化;将转化后的用户数据进行特征分割、合并和/或重组,获得多个特征值;以及将所述多个特征值写入用户信息中对应的多个特征字段。4.根据权利要求1或3所述的用户识别方法,其中所述特征为用户设备特征、用户行为特征和用户业务特征中的一种或多种。5.根据权利要求1所述的方法,其中所述机器学习模型包括以下中的一者或者多者的联用或组合:分类机器学习模型;回归机器学习模型;以及无监督机器学习模型。6.根据权利要求1所述的方法,其中确定用户的可疑程度包括确定用户可疑程度的评分分数。7.根据权利要求1所述的方法,进一步地包括:利用机器学习模型根据多个用户的用户信息,将用户分组为一个或多个用户群组;获得所述一个或多个用户群组的共性参数及其值。8.根据权利要求7所述的方法,进一步包括:根据一个或多个用户群组的共性参数及其值确定对应的用户群组是否为可疑用户群组。9.根据权利要求1所述的方法,其中用户数据之间的关联包括用户设备之间的关联,所述用户设备之间的关联包括以下的一者或多者:多个用户设备属于同一用户;多个用户设备属于与同一用户有关联的多个用户;以及多个用户设备属于与多个用户有关联的多个用户。10.根据权利要求1所述的方法,其中用户行为模式稀有性的增加包括以下的一者或多者:识别出批量用户的稀有性行为模式;行为模式稀有性增加超过预定的阈值;行为模式稀有性增加的时间段小于预定时间段;以及行为模式稀有性增加与一个用户或多个关联用户有关。11.一种客户端设备,包括:显示器,用于向用户提供应用操作界面;通信单元;以及处理器,其与显示器和通信单元连接;其中,所述处理器经配置包...

【专利技术属性】
技术研发人员:戴微帆
申请(专利权)人:上海基分文化传播有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1