The invention discloses a method for calculating the installation rate of Internet cafes based on the non-linear least squares model, which includes steps 1: setting the random distribution of the clients installed in Internet cafes, no group of people coming to the internet, and the random choice of seats; step 2: collecting the detection number and installation number of Internet cafes online clients every fixed time by real-time dotting, and acquiring them after n times of acquisition. Sample size n of online detection and installation number of Internet cafes data, draw the installation number sample distribution map and calculate the skew of installation number sample distribution, where n > 2; Step 3, installation number sample distribution map and calculated installation number sample distribution skew, understand the distribution of online client detection number and installation number of Internet cafes, determine whether there are any abnormalities in installation number, need Step 4: Estimate the installation rate of Internet cafes under the constraints of parameters by using the non-linear least squares model. The invention has the advantages of robust calculation results and more real estimated installation rate of Internet cafes.
【技术实现步骤摘要】
基于非线性最小二乘模型测算网吧安装率的方法
本专利技术涉及一种软件安装率的测算技术,具体的说是涉及基于非线性最小二乘模型测算网吧安装率的方法。
技术介绍
客户端是否安装软件一般是通过路由器对客户端进行监控,先根据设定的规则通过UDP广播包通知客户端,当客户端收到广播包后回应约定的消息给路由器,再由路由器根据客户端的回应来判断是否安装,路由器每隔一定的时间把客户端在线总数和客户端安装数的统计信息上传到WEB管理平台,并将日志数据存放到Hadoop平台中用于算法处理。软件安装率真实值=总客户端安装数/总客户端数,因数据采集只能监控实时在线安装数和在线客户端数,并不能反映处软件的真实安装率,故而每一次采集数据计算得到的安装率(即在线安装数/在线客户端数)仅是对真实安装率的估计值。当需要获得软件真实安装率时,通常是通过多次采集数据的安装率的平均值来代表真实安装率的,根据点估计原理,只有在抽样次数足够多时,样本估计的平均值才会接近于真实值。然而,在实际应用中,通常会因软件bug、杀毒软件拦截、多镜像等原因导致路由器采集的数据异常,使得安装率极易受到极大或极小时点安装率的影响,从而导致计算结果不稳健。并且在总的客户端中还会包含部分不能安装软件的白名单,如摄像头、无盘服务器、交换机之类的,若存在wifi直连路由器的特殊情况,检测的客户端数还会包含手机数,故软件的安装率应为在线安装数/剔除白名单和手机数后的在线客户端数。对于特定网吧,白名单的个数相对固定,而手机数相对不可控,手机数会随着上网人数变化而波动,因手机问题较复杂且属于特殊情况,故不考虑手机数问题,只需剔除白名单 ...
【技术保护点】
1.基于非线性最小二乘模型测算网吧安装率的方法,其特征在于,包括如下步骤:步骤一、设定网吧安装的客户端分布随机,来上网的人无成群结队,座位的选择较随机;步骤二、通过实时打点的方式每隔固定时间采集一次网吧在线客户端检测数和安装数,经过n次采集后,获取样本量为n的网吧在线检测数和安装数的数据,绘制安装数样本分布图并计算安装数样本分布的偏度值skew,其中n>2;步骤三、根据步骤二的安装数样本分布图和计算出的安装数样本分布偏度值skew,了解网吧在线客户端安装数的样本分布情况,判断是否存在异常安装数需要处理的情况,并同时对安装数的取值变异个数不足、安装数最大值不大于1的网吧给予特殊赋值;其中,所述安装数的取值变异个数不足表示的是安装数的取值变异个数≤1;(1)当安装数的取值变异个数≤1时,给予网吧安装率赋值‑1;(2)当安装数最大值≤1时,给予网吧安装率赋值0;(3)当安装数的取值变异个数>1且安装数最大值>1且无异常安装数的需处理时,直接使用非性最小二模型估算网吧安装率P;(4)当安装数的样本取值变异个数>1且安装数最大值>1且同时存在异常安装数的需处理时,先剔除异常安装数的样本值,然后观 ...
【技术特征摘要】
1.基于非线性最小二乘模型测算网吧安装率的方法,其特征在于,包括如下步骤:步骤一、设定网吧安装的客户端分布随机,来上网的人无成群结队,座位的选择较随机;步骤二、通过实时打点的方式每隔固定时间采集一次网吧在线客户端检测数和安装数,经过n次采集后,获取样本量为n的网吧在线检测数和安装数的数据,绘制安装数样本分布图并计算安装数样本分布的偏度值skew,其中n>2;步骤三、根据步骤二的安装数样本分布图和计算出的安装数样本分布偏度值skew,了解网吧在线客户端安装数的样本分布情况,判断是否存在异常安装数需要处理的情况,并同时对安装数的取值变异个数不足、安装数最大值不大于1的网吧给予特殊赋值;其中,所述安装数的取值变异个数不足表示的是安装数的取值变异个数≤1;(1)当安装数的取值变异个数≤1时,给予网吧安装率赋值-1;(2)当安装数最大值≤1时,给予网吧安装率赋值0;(3)当安装数的取值变异个数>1且安装数最大值>1且无异常安装数的需处理时,直接使用非性最小二模型估算网吧安装率P;(4)当安装数的样本取值变异个数>1且安装数最大值>1且同时存在异常安装数的需处理时,先剔除异常安装数的样本值,然后观测是否存在需重新设置取值范围的特殊情况,即是否存在检测到的的上限10的情况;(4a)若检测到的安装数最大值<10时,在剔除异常安装数的样本值后,先将的上限改为检测到的安装数最大值,然后再使用非性最小二模型进行网吧安装率P估算;(4b)若检测...
【专利技术属性】
技术研发人员:赵丽丽,祝小斌,
申请(专利权)人:武汉文网亿联科技有限公司,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。