The invention relates to a user identification method and system. The user identification method includes: collecting user data when the user is using the application; preprocessing the collected user data to generate user information composed of multiple features; and using machine learning model to determine the suspicious degree of the user according to the user information; the suspicious degree of the user is at least partially based on the current user data and their calendar. History corresponds to the increase in association between data and/or the rarity of user behavior patterns. The user identification system includes: application interface; user data or user information for receiving clients; and computing core; computing core is configured to use user data or user information, and machine learning model to determine the suspicious degree of users. The invention can penetrate suspicious users and their cheating status, timely warning, and also can deal with the cheating users according to business means and strategies, thereby protecting the legitimate rights and interests of law-abiding users and reducing the loss of application platform.
【技术实现步骤摘要】
一种用户识别方法和系统
本专利技术涉及一种网络应用技术领或,特别地涉及一种用户识别方法和系统。
技术介绍
随着网络应用,尤其是各类移动应用的发展,各类应用为人们提供了越来越便利的生活。然而,目前在网络社交媒体应用中频繁出现的水军、为了获取应用提供的优惠而出现的欺骗行为,,从用户的角度来说,影响了真正用户应获取的优惠和利益;从应用提供者的角度而言,既被恶意用户套取了利益,也没有达到鼓励用户提高应用使用率的目的。因而,对于这些恶意用户的识别成为了目前网络应用领域中的一项难题。
技术实现思路
针对现有技术中存在的技术问题,本专利技术提出了一种用户识别方法和系统,用于识别当前各类应用的恶意用户。为解决上述技术问题,本专利技术提供了一种用户识别方法,其中包括:收集用户在使用应用时的用户数据;对收集到的用户数据进行预处理,生成由多个特征组成的用户信息;以及根据所述用户信息,利用机器学习模型,确定用户的可疑程度;其中所述用户的可疑程度至少部分基于当前用户数据之间及其和历史对应数据之间的关联和/或用户行为模式稀有性的增加。优选地,所述用户数据包括以下中的一者或多者:用户的个人信息;用户行为和行为时间;用户行为来源以及数字指纹;用户行为产生的数据;用户业务数据;以及与用户账户相关联的帐户信息。优选地,所述用户数据进行预处理包括:将收集到的用户数据进行格式和/或类型的转化;将转化后的用户数据进行特征分割、合并和/或重组,获得多个特征值;以及将所述多个特征值写入用户信息中对应的多个特征字段。优选地,所述特征为用户设备特征、用户行为特征和用户业务特征中的一种或多种。优选地,所述机器学 ...
【技术保护点】
1.一种可疑用户识别方法,其中包括:收集用户在使用应用时的用户数据;对收集到的用户数据进行预处理,生成由多个特征组成的用户信息;以及根据所述用户信息,利用机器学习模型,确定用户的可疑程度;其中所述用户的可疑程度至少部分基于当前用户数据之间及其和历史对应数据之间的关联和/或用户行为模式稀有性的增加。
【技术特征摘要】
1.一种可疑用户识别方法,其中包括:收集用户在使用应用时的用户数据;对收集到的用户数据进行预处理,生成由多个特征组成的用户信息;以及根据所述用户信息,利用机器学习模型,确定用户的可疑程度;其中所述用户的可疑程度至少部分基于当前用户数据之间及其和历史对应数据之间的关联和/或用户行为模式稀有性的增加。2.根据权利要求1所述的方法,其中所述用户数据包括以下中的一者或多者:用户的个人信息;用户行为和行为时间;用户行为来源以及数字指纹;用户行为产生的数据;用户业务数据;以及与用户账户相关联的帐户信息。3.根据权利要求1所述的方法,其中所述用户数据进行预处理包括:将收集到的用户数据进行格式和/或类型的转化;将转化后的用户数据进行特征分割、合并和/或重组,获得多个特征值;以及将所述多个特征值写入用户信息中对应的多个特征字段。4.根据权利要求1或3所述的用户识别方法,其中所述特征为用户设备特征、用户行为特征和用户业务特征中的一种或多种。5.根据权利要求1所述的方法,其中所述机器学习模型包括以下中的一者或者多者的联用或组合:分类机器学习模型;回归机器学习模型;以及无监督机器学习模型。6.根据权利要求1所述的方法,其中确定用户的可疑程度包括确定用户可疑程度的评分分数。7.根据权利要求1所述的方法,进一步地包括:利用机器学习模型根据多个用户的用户信息,将用户分组为一个或多个用户群组;获得所述一个或多个用户群组的共性参数及其值。8.根据权利要求7所述的方法,进一步包括:根据一个或多个用户群组的共性参数及其值确定对应的用户群组是否为可疑用户群组。9.根据权利要求1所述的方法,其中用户数据之间的关联包括用户设备之间的关联,所述用户设备之间的关联包括以下的一者或多者:多个用户设备属于同一用户;多个用户设备属于与同一用户有关联的多个用户;以及多个用户设备属于与多个用户有关联的多个用户。10.根据权利要求1所述的方法,其中用户行为模式稀有性的增加包括以下的一者或多者:识别出批量用户的稀有性行为模式;行为模式稀有性增加超过预定的阈值;行为模式稀有性增加的时间段小于预定时间段;以及行为模式稀有性增加与一个用户或多个关联用户有关。11.一种客户端设备,包括:显示器,用于向用户提供应用操作界面;通信单元;以及处理器,其与显示器和通信单元连接;其中,所述处理器经配置包...
【专利技术属性】
技术研发人员:戴微帆,
申请(专利权)人:上海基分文化传播有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。