【技术实现步骤摘要】
本专利技术涉及互联网
更具体的,本专利技术涉及一种利用互联互通口URL日志来统计ISP间URL域名活跃度的方法。
技术介绍
近年来,随着光纤普及以及互联网带宽的迅猛发展,国内互联网各个ISP厂商之间的市场竞争愈发激烈,各个运营商的竞争已经逐步转移到服务的竞争,都在力争打造自己的生态圈争取更多的用户使用自己的入口,国内各个运营商逐步向以客户为中心的思维运营模式做转变,新的商业模式和日趋激烈的竞争对各个运营商的管理提出了新的要求和挑战。
技术实现思路
本专利技术主要目的是通过对互联互通口的URL进行分析,深入分析URL活跃情况,进一步了解用户的上网行为,以便于及时把握上网用户的情况。根据本专利技术一方面,提供了一种ISP间互联口URL活跃度统计方法,包括步骤1、收集预定时间周期内被访问的URL网页数据,对预定时间周期内点击访问的URL网页的被访问次数进行统计,获得访问次数排名靠前的预定数量的高活跃度URL及访问时间长度;步骤2、对所述预定数量的URL中新出现的URL网页的内容进行内容特征词的查找,与预先建立的特征词数据库中的特征词进行比对,划分该URL网页的内容特征方向以及内容权重并存储;步骤3、对所述高活跃度URL,依据其访问次数、内容特征方向和访问时间长度进行加权平均分析,得到每个URL的活跃度指数UAI;步骤4、利用所述活跃度指数UAI对所述URL的活跃度进行排名。< ...
【技术保护点】
一种ISP间互联口URL活跃度统计方法,包括步骤1、收集预定时间周期内被访问的URL网页数据,对预定时间周期内点击访问的URL网页的被访问次数进行统计,获得访问次数排名靠前的预定数量的高活跃度URL及访问时间长度;步骤2、对所述预定数量的URL中新出现的URL网页的内容进行内容特征词的查找,与预先建立的特征词数据库中的特征词进行比对,划分该URL网页的内容特征方向以及内容权重并存储;步骤3、对所述高活跃度URL,依据其访问次数、内容特征方向和访问时间长度进行加权平均分析,得到每个URL的活跃度指数UAI;步骤4、利用所述活跃度指数UAI对所述URL的活跃度进行排名。
【技术特征摘要】
1.一种ISP间互联口URL活跃度统计方法,包括
步骤1、收集预定时间周期内被访问的URL网页数据,对预定时间周
期内点击访问的URL网页的被访问次数进行统计,获得访问次数排名靠
前的预定数量的高活跃度URL及访问时间长度;
步骤2、对所述预定数量的URL中新出现的URL网页的内容进行内
容特征词的查找,与预先建立的特征词数据库中的特征词进行比对,划分
该URL网页的内容特征方向以及内容权重并存储;
步骤3、对所述高活跃度URL,依据其访问次数、内容特征方向和访
问时间长度进行加权平均分析,得到每个URL的活跃度指数UAI;
步骤4、利用所述活跃度指数UAI对所述URL的活跃度进行排名。
2.如权利要求1所述的方法,其中,所述步骤1收集一天内被访问
的URL网页数据,并对当天内点击访问的URL网页的被访问次数进行统
计,获得访问次数排名前200名的URL进行统计。
3.如权利要求1所述的方法,其中,步骤2还包括:
步骤201、对所述新出现的URL网页的内容进行文本分词;
步骤202、对所得到的文本分词进行特征向量计算,所述特征向量用
于体现分词后独立词出现的频率;
步骤203、根据所述特征向量确定独立词的频率高于预定阈值的分词,
利用其特征向量将所述新出现的URL网页划分至预先定义好的URL类别
中。
4.如权利要求1所述的方法,其中,步骤3中所述URL的活跃度指
数UAI为URL出现次数指数、URL内容特征指数和URL停留时间指数
的加权和;所述URL出现次数指数为URL当天出现次数、URL前7天
出现次数、URL前30天出现次数、7天内最高次数和7天内平均次数的
加权和;所述URL内容特征指数为该URL对应网页内容中的内容特征词
分数合计;URL停留时间指数为停留时间合计和平均停留时间的加权和。
5.如权利要求4所述的方法,其中,步骤1还包括:
步骤101:收集预定时间周期内被点击访问的URL网页数据;
步骤102:提取出目前已有的URL活跃度数据库中活跃度指数UAI
大于90的已有高活跃度URL,利用所述已有高活跃度URL对所述提取的
URL网页数据进行排查,统计其被访问次数和访问时间长度;
步骤103:从所提取的URL网页数据中提取不在所述已有URL活跃
度数据库中的新出现的URL,利用所述U...
【专利技术属性】
技术研发人员:黄友俊,李星,吴建平,段晓磊,邓斌,
申请(专利权)人:赛尔网络有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。