【技术实现步骤摘要】
用于确定公共wifi类别的数据处理系统
[0001]本专利技术涉及计算机
,尤其涉及一种用于确定公共wifi类别的数据处理系统。
技术介绍
[0002]随着信息技术的快速发展,公共wifi覆盖范围越来越广,在很多数据分析场景中,需要基于公共wifi类别进行数据分析,那么首先需要确定公共wifi所述的类别,例如医院wifi、商场wifi、高铁wifi等。现有技术通常基于公共wifi的名称等特征建立分类模型,来识别公共wifi类别,由于有些公共wifi可能并没有按照其他公共wifi的命名规则进行命名,会导致无法准确识别出公共wifi类别,此外,若公共wifi更名,或者随着新的公共wifi的加入,会使得分类模型的精确度降低。由此可知,如何提高确定公共wifi的精确度成为亟待解决的技术问题。
技术实现思路
[0003]本专利技术目的在于,提供一种用于确定公共wifi类别的数据处理系统,能够准确地确定公共wifi的类别。
[0004]根据本专利技术一方面,提供了一种用于确定公共wifi类别的数据处理系统,包括数据库、app类别映射表、处理器和存储有计算机程序的存储器,所述数据库用于存储设备上报记录,所述设备上报记录包括设备id、app特征信息、wifi信息和时间信息,所述app特征信息包括app安装信息和/或app活跃信息;所述app类别映射表用于存储appid和app类别的映射关系,当所述处理器执行所述计算机程序时,实现以下步骤:
[0005]步骤S1、从所述数据库中获取预设时间段内的公 ...
【技术保护点】
【技术特征摘要】
1.一种用于确定公共wifi类别的数据处理系统,其特征在于,包括数据库、app类别映射表、处理器和存储有计算机程序的存储器,所述数据库用于存储设备上报记录,所述设备上报记录包括设备id、app特征信息、wifi信息和时间信息,所述app特征信息包括app安装信息和/或app活跃信息;所述app类别映射表用于存储app id和app类别的映射关系,当所述处理器执行所述计算机程序时,实现以下步骤:步骤S1、从所述数据库中获取预设时间段内的公共wifi列表{wifi1,wifi2,...wifi
M
},其中,wifi
m
表示第m个公共wifi,m的取值为1到M;步骤S2、获取wifi
m
对应的目标app候选集{app
m1
,app
m2
,...app
mN
},其中,app
mn
表示第m个公共wifi对应的第n个目标候选app,n的取值为1到N,所述目标候选app指的是app特征对于公共wifi显著度符合预设显著度要求的非头部app;步骤S3、从所述数据库中获取所述预设时间段内,全量数据中安装app
mn
的设备总数C
mn
和wifi
m
所连接的安装app
mn
的设备总数D
mn
,基于C
mn
和D
mn
确定app
mn
相对于wifi
m
的第一特征占比值A
mn
,A
mn
=D
mn
/C
mn
,将所有的A
mn
排序,确定A
mn
的最大值对应的app;步骤S4、从所述数据库中获取所述预设时间段内,全量数据中连接wifi
m
的设备总数E
m
,基于E
m
和D
mn
确定app
mn
相对于wifi
m
的第二特征占比值G
mn
=D
mn
/E
m
,将所有的G
mn
排序,确定G
mn
的最大值对应app;步骤S5、基于所述app类别映射表判断所述A
mn
的最大值对应的app和G
mn
的最大值对应app是否属于同一类别,若属于,则将该类别确定为wifi
m
的类别。2.根据权利要求1所述的系统,其特征在于,优选的,所述步骤S1包括:步骤S11、遍历所述数据库,获取所述预设时间段内每一wifi连接设备的数量、连接设备的频次和单个设备连接的频度中的一种或多种,并加权求和得到第一参考值,将第一参考值大于阈值从参考值阈值的wifi确定为候选wifi,构建wifi候选列表;步骤S12、可将所述wifi候选列表中的wifi去重,并将其中的无效wifi和在所述预设时间段内连接设备的数量超过预设的连接数量阈值的wifi去除,得到所述公共wifi列表{wifi1,wifi2,...wifi
M
}。3.根据权利要求1所述的系统,其特征在于,优选的,所述步骤S2包括:步骤S21、从所述数据库中获取wifi
m
在所述预设时间段内所连接的设备对应的所有非头部app列表{app'
m1
,app'
m2
,...app'
mX
},其中,app'
mx
表示wifi
m
对应的第x个所述非头部,x的取值范围为1到X,非头部app指的是在所述预设时间段内安装量小于预设安装阈值的app;步骤S22、将所述数据库全量数据中,安装app'
mx
的设备id确定为第一目标样本,从所述述数据库全量数据中随机抽取与第一目标样本数量相同的设备id作为第一自然样本,基于所述第一目标样本和第一自然样本确定app'
mx
的第一显著度H'
mx
:其中,表示第一目标样本中安装的app'
mx
数量与第一目标样本中安装的所有app数量的比值,表示第一自然...
【专利技术属性】
技术研发人员:方毅,吕繁荣,尹祖勇,孙勇韬,李正,曾昱深,
申请(专利权)人:杭州云深科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。