System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及互联网,特别是涉及一种用于假量数据的筛查方法、电子设备及存储介质。
技术介绍
1、目前,在使用app进行推广时,需要找到合适的平台和有效受众,一般使用多个渠道进行数据分析,判断是否有大量假量数据,做各种数据分析的前提是拿到准确数据,如果数据不够准确,基于此数据进行分析也没有任何意义,因此,对于数据假量的筛选尤为重要;如何识别出假量数据是进行各项工作的前提。
技术实现思路
1、针对上述技术问题,本专利技术采用的技术方案为:一种用于假量数据的筛查方法,所述方法用于基于设备id筛选出假量数据从而获取到目标app的活跃度,其中,目标app所在的设备集成有用于采集设备信息的目标sdk,所述设备信息至少包括设备已安装软件信息、设备用户与目标app的目标软件交互信息、设备硬件信息和设备版本信息,所述设备id具有校验位;
2、其中,所述方法包括如下步骤:
3、s100,获取待识别id列表a={a1,a2,…,ai,…,am},ai是第i个待识别id,i的取值范围是1到m,m是待识别id的数量;
4、s200,基于ai的校验位对ai进行真实性校验,并将校验成功的待识别id标记为第一中间id以获取第一中间id列表;
5、s300,获取第一中间id对应的目标软件交互信息,若第一中间id对应的目标软件最新一次打开时间在预设时间范围内,将第一中间id标记为第二中间id,从而获取第二中间id列表,其中,所述目标软件交互信息记录有目标app最新一次打
6、s400,获取第二中间id对应的设备硬件信息和设备已安装软件信息,且当第二中间id对应的设备硬件信息和设备已安装软件信息均满足第一预设条件时,将第二中间id标记为第三中间id,从而获取第三中间id列表;
7、s500,获取第三中间id的版本信息,且当第三中间id的版本信息满足第二预设条件时,将第三中间id标记为第四中间id,从而获取第四中间id;
8、s600,将第四中间id进行聚类计算,并获取聚类后每个簇包含的第四中间id的数量,当一个簇包含的第四中间id的数量大于预设数量阈值时,将该簇下的第四中间id标记为假量数据。
9、一种非瞬时性计算机可读存储介质,所述非瞬时性计算机可读存储介质中存储有至少一条指令或至少一段程序,其特征在于,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如所述的用于设备id的假量数据筛查方法。
10、本专利技术至少具有以下有益效果:
11、综上,获取待识别id列表,基于待识别id的校验位进行真实性校验,并将校验成功的待识别id标记为第一中间id,获取第一中间id对应的目标软件交互信息,将第一中间id列表中目标软件交互信息满足预设时间范围的第一中间id标记为第二中间id,将第二中间id列表中设备硬件信息和设备用户信息满足第一预设条件的第二中间id标记为第三中间id,将满足第二预设条件的第三中间id标记为第四中间id,对第四中间id进行聚类计算,将聚类下的簇包含的第四中间id的数量大于预设数量阈值的第四中间id作为活跃流量,通过对待识别id进行层层筛选,将校验位不符合、很久没有使用过、虚拟机、专门进行刷量的设备筛除,从而更加准确的获取到活跃流量。
本文档来自技高网...【技术保护点】
1.一种用于设备ID的假量数据筛查方法,其特征在于,所述方法用于基于设备ID筛选出假量数据从而获取到目标APP的活跃度,其中,目标APP所在的设备集成有用于采集设备信息的目标SDK,所述设备信息至少包括设备已安装软件信息、设备用户与目标APP的目标软件交互信息、设备硬件信息和设备版本信息,所述设备ID具有校验位;
2.根据权利要求1所述的用于设备ID的假量数据筛查方法,其特征在于,设备已安装软件信息满足第一预设条件包括:通话记录、联系人、短信和相册均不为空,设备已安装软件中包括有第一类预设软件列表中的至少一个软件,且不包括第二类预设软件列表中的任意一个软件,其中,第一类预设软件列表中的软件安装量>预设安装数量,第二类预设软件列表中的软件为任意模拟器中的软件。
3.根据权利要求1所述的用于设备ID的假量数据筛查方法,其特征在于,所述设备硬件包括:卡槽、插入卡槽的通信卡、电池、安装的传感器、以及设备中其它的硬件。
4.根据权利要求3所述的用于设备ID的加量数据筛查方法,其特征在于,设备硬件信息满足第一预设条件包括:所述设备具有卡槽以及插入卡槽的通信
5.根据权利要求1所述的用于设备ID的假量数据筛查方法,其特征在于,所述设备版本信息至少包括设备型号、设备厂商信息、系统版本号、基带版本号。
6.根据权利要求4所述的用于设备ID的假量数据筛查方法,其特征在于,当第二中间ID的设备硬件信息中任何一项不满足第一预设条件时,将第二中间ID认定为假量数据。
7.根据权利要求1所述的用于设备ID的假量数据筛查方法,其特征在于,所述设备信息还包括基本信息,所述基本信息至少包括:设备地理位置、设备IP、设备型号、时间戳,其中,所述时间戳为采集设备当前地理位置、IP以及设备型号的时间信息。
8.根据权利要求7所述的用于设备ID的假量数据筛查方法,其特征在于,S600包括如下步骤:
9.根据权利要求1所述的用于设备ID的假量数据筛查方法,其特征在于,还包括如下步骤:
10.一种非瞬时性计算机可读存储介质,所述非瞬时性计算机可读存储介质中存储有至少一条指令或至少一段程序,其特征在于,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1-9中任意一项所述的用于设备ID的假量数据筛查方法。
...【技术特征摘要】
1.一种用于设备id的假量数据筛查方法,其特征在于,所述方法用于基于设备id筛选出假量数据从而获取到目标app的活跃度,其中,目标app所在的设备集成有用于采集设备信息的目标sdk,所述设备信息至少包括设备已安装软件信息、设备用户与目标app的目标软件交互信息、设备硬件信息和设备版本信息,所述设备id具有校验位;
2.根据权利要求1所述的用于设备id的假量数据筛查方法,其特征在于,设备已安装软件信息满足第一预设条件包括:通话记录、联系人、短信和相册均不为空,设备已安装软件中包括有第一类预设软件列表中的至少一个软件,且不包括第二类预设软件列表中的任意一个软件,其中,第一类预设软件列表中的软件安装量>预设安装数量,第二类预设软件列表中的软件为任意模拟器中的软件。
3.根据权利要求1所述的用于设备id的假量数据筛查方法,其特征在于,所述设备硬件包括:卡槽、插入卡槽的通信卡、电池、安装的传感器、以及设备中其它的硬件。
4.根据权利要求3所述的用于设备id的加量数据筛查方法,其特征在于,设备硬件信息满足第一预设条件包括:所述设备具有卡槽以及插入卡槽的通信卡,所述电池的温度及电量随时间不断变化,安装的传感器属于第三预设传感器列表,设备中其它硬件不符合第四预设模拟...
【专利技术属性】
技术研发人员:刘桢,俞文哲,郄世杰,金岩,俞锋锋,
申请(专利权)人:泰尔卓信科技北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。