用户行为数据的处理方法及装置制造方法及图纸

技术编号：11637689 阅读：125 留言：0更新日期：2015-06-24 12:23

本发明专利技术提供一种用户行为数据的处理方法及装置。本发明专利技术实施例通过根据用户行为数据，获取同一IP地址的待评测的M个统计数据，M为大于或等于2的整数，进而将所述M个统计数据中每个统计数据分别输入对应的分类器，以获得每个分类器所输出的评测结果，并根据所述每个分类器所输出的评测结果，获得所述IP地址的分类结果，使得能够根据所述IP地址的分类结果，对所述用户行为数据进行过滤处理，以获得一次过滤的用户行为数据，由于每个分类器是分别针对不同的统计数据，使得能够充分利用每个分类器的分类能力得到用户行为数据的分类结果，从而提高了分类结果的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
【专利说明】
本专利技术涉及机器学习技术，尤其涉及一种用户行为数据的处理方法及装置。【
技术介绍
】在机器学习中，可以利用大量已知的训练样本，构建分类模型即分类器，进而利用所构建的分类器对未知的数据进行评测。分类器可以应用在很多场景，例如，由于因网络作弊而产生的垃圾页面以及垃圾用户行为数据越来越多，严重影响了搜索引擎的检索效率和用户体验，因此，反作弊已经成为搜索引擎所面临的最重要的挑战之一，可以将利用已标注的正常数据和作弊数据，构建一个分类器，以对网络数据进行识别。现有技术中，可以利用所构建的一个分类器，对用户行为数据进行评测，以获得分类结果。然而，采用单一的分类器，其所评测的用户行为数据的分类结果的准确率不高。【
技术实现思路
】本专利技术的多个方面提供一种用户行为数据的处理方法及装置，用以提高分类结果的准确率。本专利技术的一方面，提供一种用户行为数据的处理方法，包括:根据用户行为数据，获取同一 IP地址的待评测的M个统计数据，M为大于或等于2的整数；将所述M个统计数据中每个统计数据分别输入对应的分类器，以获得每个分类器所输出的评测结果；根据所述每个分类...
用户行为数据的处理方法及装置

【技术保护点】
一种用户行为数据的处理方法，其特征在于，包括：根据用户行为数据，获取同一IP地址的待评测的M个统计数据，M为大于或等于2的整数；将所述M个统计数据中每个统计数据分别输入对应的分类器，以获得每个分类器所输出的评测结果；根据所述每个分类器所输出的评测结果，获得所述IP地址的分类结果；根据所述IP地址的分类结果，对所述用户行为数据进行过滤处理，以获得一次过滤的用户行为数据。

【技术特征摘要】

【专利技术属性】
技术研发人员：常明，陈朝钢，贾少攀，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人