一种数据筛选引擎建立方法及数据筛选引擎技术

技术编号：12809327 阅读：97 留言：0更新日期：2016-02-05 08:31

本发明专利技术实施例公开一种数据筛选引擎建立方法及数据筛选引擎，解决了目前的人工方式很难从海量的用户行为中总结出区分出黑白名单的规则的技术问题。本发明专利技术实施例数据筛选引擎建立方法包括：提取已注册的用户的基础信息和用户对应的历史行为数据；根据基础信息和历史行为数据，并结合预置的复数个业务逻辑确定每个用户的特征向量；根据特征向量，并再次结合复数个业务逻辑确定高置信度名单；对高置信度名单通过采用预置分析方式进行分析，建立相对应的数据筛选规则。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据处理
，尤其涉及一种数据筛选引擎建立方法及数据筛选引擎。
技术介绍
随着网络游戏的发展，一些通过作弊程序获取经济利益的灰色产业也膨胀起来。这些作弊程序一般通过机器模拟合法用户的行为，以刷礼品，刷人气等为手段，大量消耗网络资源，严重影响平台生态的发展。为了识别这些作弊程序，一般需要构建黑白名单库，并基于该库训练出识别模型。其中黑名单一般代表使用作弊程序的账号，白名单代表合法用户帐号。黑白名单的构建一般基于历史沉淀，从大量的用户反馈和人工观察标注等记录中获取。但对于一些新业务，历史积累不足而且用户反馈缺乏，没有形成判定的标准。采用人工标注的方式来汇总黑白名单，人工量很大而且构建速度很慢。传统方法一般靠人工观察以及业务经验，从大量的结果数据中总结出规律，进而构建黑白名单。但对于一些新业务，如游戏直播，由于缺乏历史的积累，没有形成判定的标准。另一方面，业务的用户量很大，每天有数千万的用户行为数据，伪账号跟正常用户帐户混淆在一起。人工的方法很难甚至不可能从海量的用户行为中总结出区分出黑白名单的规则。上述提及的人工方式很难从海量的用户行为中总结出区分出黑白名单的规则的技术问题，已经成为了本领域技术人员亟待解决的技术问题。
技术实现思路
本专利技术实施例提供了一种数据筛选引擎建立方法及数据筛选引擎，解决了目前的人工方式很难从海量的用户行为中总结出区分出黑白名单的规则的技术问题。本专利技术实施例中提供的一种数据筛选引擎建立方法，包括：提取已注册的用户的基础信息和所述用户对应的历史行为数据；根据所述...

【技术保护点】
一种数据筛选引擎建立方法，其特征在于，包括：提取已注册的用户的基础信息和所述用户对应的历史行为数据；根据所述基础信息和所述历史行为数据，并结合预置的复数个业务逻辑确定每个用户的特征向量；根据所述特征向量，并再次结合复数个所述业务逻辑确定高置信度名单；对所述高置信度名单通过采用预置分析方式进行分析，建立相对应的数据筛选规则。

【技术特征摘要】

【专利技术属性】
技术研发人员：余建兴，
申请(专利权)人：珠海多玩信息技术有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人