用于确定公共wifi类别的数据处理系统技术方案

技术编号:30317611 阅读:16 留言:0更新日期:2021-10-09 23:20
本发明专利技术涉及一种用于确定公共wifi类别的数据处理系统,实现步骤S1、从数据库中获取预设时间段内的公共wifi列表,wifi

【技术实现步骤摘要】
用于确定公共wifi类别的数据处理系统


[0001]本专利技术涉及计算机
,尤其涉及一种用于确定公共wifi类别的数据处理系统。

技术介绍

[0002]随着信息技术的快速发展,公共wifi覆盖范围越来越广,在很多数据分析场景中,需要基于公共wifi类别进行数据分析,那么首先需要确定公共wifi所述的类别,例如医院wifi、商场wifi、高铁wifi等。现有技术通常基于公共wifi的名称等特征建立分类模型,来识别公共wifi类别,由于有些公共wifi可能并没有按照其他公共wifi的命名规则进行命名,会导致无法准确识别出公共wifi类别,此外,若公共wifi更名,或者随着新的公共wifi的加入,会使得分类模型的精确度降低。由此可知,如何提高确定公共wifi的精确度成为亟待解决的技术问题。

技术实现思路

[0003]本专利技术目的在于,提供一种用于确定公共wifi类别的数据处理系统,能够准确地确定公共wifi的类别。
[0004]根据本专利技术一方面,提供了一种用于确定公共wifi类别的数据处理系统,包括数据库、app类别映射表、处理器和存储有计算机程序的存储器,所述数据库用于存储设备上报记录,所述设备上报记录包括设备id、app特征信息、wifi信息和时间信息,所述app特征信息包括app安装信息和/或app活跃信息;所述app类别映射表用于存储appid和app类别的映射关系,当所述处理器执行所述计算机程序时,实现以下步骤:
[0005]步骤S1、从所述数据库中获取预设时间段内的公共wifi列表{wifi1,wifi2,...wifi
M
},其中,wifi
m
表示第m个公共wifi,m的取值为1到M;
[0006]步骤S2、获取wifi
m
对应的目标app候选集{app
m1
,app
m2
,...app
mN
},其中,app
mn
表示第m个公共wifi对应的第n个目标候选app,n的取值为1到N,所述目标候选app指的是app特征对于公共wifi显著度符合预设显著度要求的非头部app;
[0007]步骤S3、从所述数据库中获取所述预设时间段内,全量数据中安装app
mn
的设备总数C
mn
和wifi
m
所连接的安装app
mn
的设备总数D
mn
,基于C
mn
和D
mn
确定app
mn
相对于wifi
m
的第一特征占比值A
mn
,A
mn
=D
mn
/C
mn
,将所有的A
mn
排序,确定A
mn
的最大值对应的app;
[0008]步骤S4、从所述数据库中获取所述预设时间段内,全量数据中连接wifi
m
的设备总数E
m
,基于E
m
和D
mn
确定app
mn
相对于wifi
m
的第二特征占比值G
mn
=D
mn
/E
m
,将所有的G
mn
排序,确定G
mn
的最大值对应app;
[0009]步骤S5、基于所述app类别映射表判断所述A
mn
的最大值对应的app和G
mn
的最大值对应app是否属于同一类别,若属于,则将该类别确定为wifi
m
的类别。
[0010]本专利技术与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本专利技术提供的一种用于确定公共wifi类别的数据处理系统可达到相当的技术进步性及实用性,并
具有产业上的广泛利用价值,其至少具有下列优点:
[0011]本专利技术能够基于wifi连接的设备的app特征,建立app相对于wifi的第一特征占比值和第二特征占比值并进行碰撞,确定公共wifi的类别,提高了确定公共wifi类别的准确度。
[0012]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
[0013]图1为本专利技术实施例提供的用于确定公共wifi类别的数据处理系统示意图。
具体实施方式
[0014]为更进一步阐述本专利技术为达成预定专利技术目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本专利技术提出的一种用于确定公共wifi类别的数据处理系统的具体实施方式及其功效,详细说明如后。
[0015]在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时处理可以被终止,但是还可以具有未包括在附图中的附加步骤。处理可以对应于方法、函数、规程、子例程、子程序等等。
[0016]本专利技术实施例提供了一种用于确定公共wifi类别的数据处理系统,如图1所示,包括数据库、app(Application,应用程序)类别映射表、处理器和存储有计算机程序的存储器,所述数据库用于存储设备上报记录,所述设备上报记录包括设备id、app特征信息、wifi信息和时间信息,所述app特征信息包括app安装信息和/或app活跃信息。所述app类别映射表用于存储appid和app类别的映射关系,当所述处理器执行所述计算机程序时,实现以下步骤:
[0017]步骤S1、从所述数据库中获取预设时间段内的公共wifi列表{wifi1,wifi2,...wifi
M
},其中,wifi
m
表示第m个公共wifi,m的取值为1到M,M为正整数;
[0018]作为一种实施例,所述步骤S1可包括:
[0019]步骤S11、遍历所述数据库,获取所述预设时间段内每一wifi连接设备的数量、连接设备的频次和单个设备连接的频度中的一种或多种,并加权求和得到第一参考值,将第一参考值大于阈值从参考值阈值的wifi确定为候选wifi,构建wifi候选列表;
[0020]其中,可以理解的是,也可根据具体应用需求加入其它可以识别公共wifi的参数进行判断。
[0021]步骤S12、可将所述wifi候选列表中的wifi去重,并将其中的无效wifi和在所述预设时间段内连接设备的数量超过预设的连接数量阈值的wifi去除,得到所述公共wifi列表{wifi1,wifi2,...wifi
M
}。
[0022]需要说明的是,如何本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于确定公共wifi类别的数据处理系统,其特征在于,包括数据库、app类别映射表、处理器和存储有计算机程序的存储器,所述数据库用于存储设备上报记录,所述设备上报记录包括设备id、app特征信息、wifi信息和时间信息,所述app特征信息包括app安装信息和/或app活跃信息;所述app类别映射表用于存储app id和app类别的映射关系,当所述处理器执行所述计算机程序时,实现以下步骤:步骤S1、从所述数据库中获取预设时间段内的公共wifi列表{wifi1,wifi2,...wifi
M
},其中,wifi
m
表示第m个公共wifi,m的取值为1到M;步骤S2、获取wifi
m
对应的目标app候选集{app
m1
,app
m2
,...app
mN
},其中,app
mn
表示第m个公共wifi对应的第n个目标候选app,n的取值为1到N,所述目标候选app指的是app特征对于公共wifi显著度符合预设显著度要求的非头部app;步骤S3、从所述数据库中获取所述预设时间段内,全量数据中安装app
mn
的设备总数C
mn
和wifi
m
所连接的安装app
mn
的设备总数D
mn
,基于C
mn
和D
mn
确定app
mn
相对于wifi
m
的第一特征占比值A
mn
,A
mn
=D
mn
/C
mn
,将所有的A
mn
排序,确定A
mn
的最大值对应的app;步骤S4、从所述数据库中获取所述预设时间段内,全量数据中连接wifi
m
的设备总数E
m
,基于E
m
和D
mn
确定app
mn
相对于wifi
m
的第二特征占比值G
mn
=D
mn
/E
m
,将所有的G
mn
排序,确定G
mn
的最大值对应app;步骤S5、基于所述app类别映射表判断所述A
mn
的最大值对应的app和G
mn
的最大值对应app是否属于同一类别,若属于,则将该类别确定为wifi
m
的类别。2.根据权利要求1所述的系统,其特征在于,优选的,所述步骤S1包括:步骤S11、遍历所述数据库,获取所述预设时间段内每一wifi连接设备的数量、连接设备的频次和单个设备连接的频度中的一种或多种,并加权求和得到第一参考值,将第一参考值大于阈值从参考值阈值的wifi确定为候选wifi,构建wifi候选列表;步骤S12、可将所述wifi候选列表中的wifi去重,并将其中的无效wifi和在所述预设时间段内连接设备的数量超过预设的连接数量阈值的wifi去除,得到所述公共wifi列表{wifi1,wifi2,...wifi
M
}。3.根据权利要求1所述的系统,其特征在于,优选的,所述步骤S2包括:步骤S21、从所述数据库中获取wifi
m
在所述预设时间段内所连接的设备对应的所有非头部app列表{app'
m1
,app'
m2
,...app'
mX
},其中,app'
mx
表示wifi
m
对应的第x个所述非头部,x的取值范围为1到X,非头部app指的是在所述预设时间段内安装量小于预设安装阈值的app;步骤S22、将所述数据库全量数据中,安装app'
mx
的设备id确定为第一目标样本,从所述述数据库全量数据中随机抽取与第一目标样本数量相同的设备id作为第一自然样本,基于所述第一目标样本和第一自然样本确定app'
mx
的第一显著度H'
mx
:其中,表示第一目标样本中安装的app'
mx
数量与第一目标样本中安装的所有app数量的比值,表示第一自然...

【专利技术属性】
技术研发人员:方毅吕繁荣尹祖勇孙勇韬李正曾昱深
申请(专利权)人:杭州云深科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1