【技术实现步骤摘要】
【专利说明】
本专利技术涉及机器学习技术,尤其涉及一种用户行为数据的处理方法及装置。【
技术介绍
】在机器学习中,可以利用大量已知的训练样本,构建分类模型即分类器,进而利用所构建的分类器对未知的数据进行评测。分类器可以应用在很多场景,例如,由于因网络作弊而产生的垃圾页面以及垃圾用户行为数据越来越多,严重影响了搜索引擎的检索效率和用户体验,因此,反作弊已经成为搜索引擎所面临的最重要的挑战之一,可以将利用已标注的正常数据和作弊数据,构建一个分类器,以对网络数据进行识别。现有技术中,可以利用所构建的一个分类器,对用户行为数据进行评测,以获得分类结果。然而,采用单一的分类器,其所评测的用户行为数据的分类结果的准确率不高。【
技术实现思路
】本专利技术的多个方面提供一种用户行为数据的处理方法及装置,用以提高分类结果的准确率。本专利技术的一方面,提供一种用户行为数据的处理方法,包括:根据用户行为数据,获取同一 IP地址的待评测的M个统计数据,M为大于或等于2的整数;将所述M个统计数据中每个统计数据分别输入对应的分类器,以获得每个分类器所输出的评测结果;根据所述每个分类 ...
【技术保护点】
一种用户行为数据的处理方法,其特征在于,包括:根据用户行为数据,获取同一IP地址的待评测的M个统计数据,M为大于或等于2的整数;将所述M个统计数据中每个统计数据分别输入对应的分类器,以获得每个分类器所输出的评测结果;根据所述每个分类器所输出的评测结果,获得所述IP地址的分类结果;根据所述IP地址的分类结果,对所述用户行为数据进行过滤处理,以获得一次过滤的用户行为数据。
【技术特征摘要】
【专利技术属性】
技术研发人员:常明,陈朝钢,贾少攀,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。