一种互联网文档的总访问量的估值方法技术

技术编号:33128522 阅读:24 留言:0更新日期:2022-04-17 00:41
本发明专利技术涉及一种互联网文档的总访问量的估值方法。包括:基于网站、app、社交媒体的日平均访问量,分别构建网站、app以及社交媒体的计算模型;获取用户首发的原创互联网文档并进行初始化分析;根据计算模型分别预估访问量;对所述网站预估访问量、app预估访问量以及社交媒体访预估问量,这三个值进行求和获得当日全网总访问量,再根据发布时间t获得衰减比例,获得已发布t天数内的总访问量。本发明专利技术针对互联网中的网站、app、社交媒体为基础全面的进行估算;构建不同的模型及实现算法,同时通过校正系数、配比等分析,客观准确的在全网进行总访问量的估值,为更有效的评估网站影响力、统计效绩及通过客观性排名等需求提供更有力的数据支持。据支持。

【技术实现步骤摘要】
一种互联网文档的总访问量的估值方法


[0001]本专利技术涉及计算机软件
,具体涉及一种互联网文档的总访问量的估值方法。

技术介绍

[0002]随着互联网技术的不断发展,以平均每周使用互联网至少1小时来看作网民的认定标准,截至2021年6月,中国网民规模达10.11亿,较2020年12月增长2175万,互联网普及率达71.6%。在这么高的普及率的前提下,人们日常的生活逐步迁移至网络中,尤其是客户端的APP等的发展,人们逐渐形成了在终端进行碎片化阅读、评价、点赞、分享等习惯。相对的,对于运营网站或APP的商家或个人来说,了解互联网中的访问量或自己网站的访问量,可以了解用户的习惯、定向对用户运营,可以准确找到网络热点等,对于运营有极大的作用。
[0003]目前已经存在很多网站访问量的统计技术,如Alexa是一家专门发布网站世界排名的网站。以搜索引擎起家的Alexa创建于1996年4月(美国),目的是让互联网网民在分享虚拟世界资源的同时,更多地参与互联网资源的组织。Alexa每天在网上搜集超过1,000GB的信息,不仅给出多达几十亿的网址链接,而且为其中的每一个网站进行了排名。可以说,Alexa是当前拥有URL数量最庞大,排名信息发布最详尽的网站。
[0004]目前还有很多研究主要对于页面访问量的统计及分析,或基于页面访问量的用户行为分析访。其中如专利文件1CN106210044B,涉及一种基于访问行为的活跃用户识别方法,是依据用户对网站各个模块的访问量,用于判别用户身份识别方法。如专利文件2,CN104504077B页面访问数据的统计方法和装置,解决的是现有技术对访问网页对象的统计请求进行处理时效率低下的问题;而专利文件3CN100566262显示访问量数据的方法及数据访问量发送装置,则采用将统计范围划分为一级或多级区域,计算该区域内的一个页面访问人数信息,所述页面由页面服务器提供,依据区域内的页面的访问人数信息的表征信息,直观地获得不同区域访问页面的情况;专利文件4CN2014100428654一种网络中到访信息收集的方法和系统,涉及的是网络中到访信息收集的方法和系统,解决的是人工手动的方式进行统计,占用管理人员的统计时间比较长,统计效率低下的问题;专利文件5CN104572037A一种基于JavaScript技术的智能统计页面访问量的实现方法,这种方法具体的步骤是添加统计页面,填写统计页面名,起始统计数、绑定ID,在统计管理里面生成一条记录,还需要权限设置等。综合上述现有技术可知,目前的访问量的统计主要集中于某些或局域网站或网页的访问量的研究统计,或针对于用户的行为分析等,缺乏全互联网的访问量的统计方法,尤其是缺乏一种互联网文档在全互联网的访问量的统计方法。
[0005]由于,随着微媒体及信息数字化的法展,一篇互联网文档(这里指互联网上的超文本文件,可以为网站的一个页面,也可以为如微信公众号、头条号、强国号等网页文章。文件内容可以是文字、图片、视频等信息)除了在自有的网站发布外,还可能在自有的app、公众号等新媒体上发布,也有可能被各种各样的网站、app、新媒体引用和发布。尤其是,有些网
站往往不会提供互联网文档在该网站的具体的访问量的数值信息。
[0006]另外,各种新媒体网站、应用也是层出不穷,它们在互联网上的影响力也不一样,而评估一篇文档在整个互联网的总访问量是评估这篇互联网文档在该媒体网站影响力的重要指标,尤其是面对亟需依靠这种影响力评估来统计效绩的采编权的机构;或者,面对亟需在全互联网的范围内的评估政策决策的政府门面或新闻网站;尤其是面对于某些有榜单机制的互联网机构,其排名的客观性极为重要,尤其是作为一个领域的指南性质的排名榜单。原有的网上评估量用户访问量的方法是在本网站上获取用户行为数据,经过数据处理得出文档的访问量,现在各大媒体机构发布的文档大量的转载、转发至各个网站、应用上,但是不是每个网站、应用都有文档访问量的统计。
[0007]因此,亟待找到一种能够较为准确、全面地计算互联网文档在全互联网中的访问量的方法。

技术实现思路

[0008]为了解决如何更为准确、全面地计算互联网文档在全互联网(下称全网)中的访问量,本专利技术提供了一种互联网文档的总访问量的估值方法。
[0009]本专利技术请求保护以下技术方案:
[0010]本专利技术提供了一种互联网文档的总访问量的估值方法,其特征在于,包括以下步骤:
[0011]S1构建访问量预估值计算模型:基于网站、app、社交媒体的日平均访问量,分别构建网站各栏目的访问量预估值计算模型、app各栏目的访问量预估值计算模型以及社交媒体模型比例系数计算模型;
[0012]S2获取待评估互联网文档信息:获取用户首发布的原创互联网文档,并对所述互联网文档在步骤S1中构建的计算模型中进行初始化分析;
[0013]S3根据计算模型分别预估访问量:将步骤S2中的初始化值根据步骤S1构建的所述网站各栏目的访问量预估值计算模型、所述app各栏目的访问量预估值计算模型以及所述社交媒体模型比例系数计算模型分别计算一段时间内的对应的访问量预估值,记为网站预估访问量、app预估访问量以及社交媒体访预估问量,并将将其记录至数据库的文档当日访问量表中;
[0014]S4计算全网访问量:对所述网站预估访问量、app预估访问量以及社交媒体访预估问量,这三个值进行求和获得当日全网总访问量;再根据发布时间t获得衰减比例,所述衰减比例计算方法为k=0.963
t
,t为已发布天数,k为衰减比例;首日全网访问量+当日全网访问量*k=全网总访问量,即已发布t天数内的总全网访问量。
[0015]进一步的,所述构建网站各栏目的访问量预估值计算模型包括以下过程:
[0016](1)获取alexa中各个网站近一月日均pv值及排名情况;
[0017](2)根据alexa获取的网站排名情况,在所述数据库的文档当日访问量表中,记录排名第一的网站的默认访问量预估值,并依次记录其他网站的默认访问量预估值直到记录到最低值;所述默认访问量预估值的设置根据近30天的日均pv进行计算,根据网站日均pv值与第一名网站日均pv值对比计算访问量预估值;
[0018](3)根据获取的待评估的所述互联网文档的信息,将转发过所述互联网文档的网
站栏目进行整理去重,获得准确的转发过所述互联网文档的网站栏目列表,进而对所述网站栏目列表中的网站栏目做访问量预估值的初始化更新,得到所有的所述网站栏目对应的访问量预估值;
[0019](4)判断所述栏目列表中所有的所述网站栏目,是否包含首页、轮播、推荐等重点栏目名称词汇,若包含,则将得到的所述网站栏目对应的访问量预估值乘以校正系数x;若不包含,则乘以校正系数y,得到校正后的所述网站栏目对应的访问量预估值;
[0020]其中,校正系数x=[1,10],校正系数y=[0.1

1]。
[0021]进一步的,所述构建网站各栏目的访问量预估值计算模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种互联网文档的总访问量的估值方法,其特征在于,包括以下步骤:S1构建访问量预估值计算模型:基于网站、app、社交媒体的日平均访问量,分别构建网站各栏目的访问量预估值计算模型、app各栏目的访问量预估值计算模型以及社交媒体模型比例系数计算模型;S2获取待评估互联网文档信息:获取用户首发布的原创互联网文档,并对所述互联网文档在步骤S1中构建的计算模型中进行初始化分析;S3根据计算模型分别预估访问量:将步骤S2中的初始化值根据步骤S1构建的所述网站各栏目的访问量预估值计算模型、所述app各栏目的访问量预估值计算模型以及所述社交媒体模型比例系数计算模型分别计算一段时间内的对应的访问量预估值,记为网站预估访问量、app预估访问量以及社交媒体访预估问量,并将将其记录至数据库的文档当日访问量表中;S4计算全网访问量:对所述网站预估访问量、app预估访问量以及社交媒体访预估问量,这三个值进行求和获得当日全网总访问量;再根据发布时间t获得衰减比例,所述衰减比例计算方法为k=0.963
t
,t为已发布天数,k为衰减比例;首日全网访问量+当日全网访问量*k=全网总访问量,即已发布t天数内的总全网访问量。2.根据权利要求1所述的互联网文档的总访问量的估值方法,其特征还在于,所述构建网站各栏目的访问量预估值计算模型包括以下过程:(1)获取alexa中各个网站近一月日均pv值及排名情况;(2)根据alexa获取的网站排名情况,在所述数据库的文档当日访问量表中,记录排名第一的网站的默认访问量预估值,并依次记录其他网站的默认访问量预估值直到记录到最低值;所述默认访问量预估值的设置根据近30天的日均pv进行计算,根据网站日均pv值与第一名网站日均pv值对比计算访问量预估值;(3)根据获取的待评估的所述互联网文档的信息,将转发过所述互联网文档的网站栏目进行整理去重,获得准确的转发过所述互联网文档的网站栏目列表,进而对所述网站栏目列表中的网站栏目做访问量预估值的初始化更新,得到所有的所述网站栏目对应的访问量预估值;(4)判断所述栏目列表中所有的所述网站栏目,是否包含首页、轮播、推荐等重点栏目名称词汇,若包含,则将得到的所述网站栏目对应的访问量预估值乘以校正系数x;若不包含,则乘以校正系数y,得到校正后的所述网站栏目对应的访问量预估值;其中,校正系数x=[1,10],校正系数y=[0.1

1]。3.根据权利要求2所述的互联网文档的总访问量的估值方法,其特征还在于,所述步骤(3)具体还包括:通过访问数据库,获取所述互联网文档在各个网站的转发情况,整理成网站

栏目的对应关系,将得到的对应关系处理成网站

栏目列表的列表,即所述网站栏目列表;若有新的栏目出现,且不存在所述互联网文档的栏目列表中,则初始化所述新栏目访问量预估值,通过访问数据库获取所述网站栏目列表中的所有栏目的访问量预估值,得到包含新栏目的所有的所述网站栏目对应的访问量预估值。4.根据权利要求1或2或3所述的互联网文档的总访问量的估值方法,其特征还在于,根据所述网站栏目列表及校正后的所述网站栏目对应的访问量预估值进行求和,得到
的求和值即为所述互联网文档在该网站访问量预估值;最后,对所有转发过所述互联网文档的网站的访问量预估值进行求和,即为所述网站预估访问量。5.根据权利要求1所述的互联网文档的总访问量的估值方法,其特征还在于,所述构建app各栏目的访问量预估值计算模型,包括以下过程:(1)根据获取的待评估的所述互联网文档的信息,通过数据中心采集所述互联网文档在app中的转发情况,并对采集的数据进行整理去重,得到准确的转发所述互联网文档的app及app中的栏目列表;(...

【专利技术属性】
技术研发人员:黄鸿发崔宏彩赵冠磊江敏
申请(专利权)人:拓尔思信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1