【技术实现步骤摘要】
一种互联网文档的总访问量的估值方法
[0001]本专利技术涉及计算机软件
,具体涉及一种互联网文档的总访问量的估值方法。
技术介绍
[0002]随着互联网技术的不断发展,以平均每周使用互联网至少1小时来看作网民的认定标准,截至2021年6月,中国网民规模达10.11亿,较2020年12月增长2175万,互联网普及率达71.6%。在这么高的普及率的前提下,人们日常的生活逐步迁移至网络中,尤其是客户端的APP等的发展,人们逐渐形成了在终端进行碎片化阅读、评价、点赞、分享等习惯。相对的,对于运营网站或APP的商家或个人来说,了解互联网中的访问量或自己网站的访问量,可以了解用户的习惯、定向对用户运营,可以准确找到网络热点等,对于运营有极大的作用。
[0003]目前已经存在很多网站访问量的统计技术,如Alexa是一家专门发布网站世界排名的网站。以搜索引擎起家的Alexa创建于1996年4月(美国),目的是让互联网网民在分享虚拟世界资源的同时,更多地参与互联网资源的组织。Alexa每天在网上搜集超过1,000GB的信息,不仅给出多达几十亿的网址链接,而且为其中的每一个网站进行了排名。可以说,Alexa是当前拥有URL数量最庞大,排名信息发布最详尽的网站。
[0004]目前还有很多研究主要对于页面访问量的统计及分析,或基于页面访问量的用户行为分析访。其中如专利文件1CN106210044B,涉及一种基于访问行为的活跃用户识别方法,是依据用户对网站各个模块的访问量,用于判别用户身份识别方法。如专利文件2,CN1 ...
【技术保护点】
【技术特征摘要】
1.一种互联网文档的总访问量的估值方法,其特征在于,包括以下步骤:S1构建访问量预估值计算模型:基于网站、app、社交媒体的日平均访问量,分别构建网站各栏目的访问量预估值计算模型、app各栏目的访问量预估值计算模型以及社交媒体模型比例系数计算模型;S2获取待评估互联网文档信息:获取用户首发布的原创互联网文档,并对所述互联网文档在步骤S1中构建的计算模型中进行初始化分析;S3根据计算模型分别预估访问量:将步骤S2中的初始化值根据步骤S1构建的所述网站各栏目的访问量预估值计算模型、所述app各栏目的访问量预估值计算模型以及所述社交媒体模型比例系数计算模型分别计算一段时间内的对应的访问量预估值,记为网站预估访问量、app预估访问量以及社交媒体访预估问量,并将将其记录至数据库的文档当日访问量表中;S4计算全网访问量:对所述网站预估访问量、app预估访问量以及社交媒体访预估问量,这三个值进行求和获得当日全网总访问量;再根据发布时间t获得衰减比例,所述衰减比例计算方法为k=0.963
t
,t为已发布天数,k为衰减比例;首日全网访问量+当日全网访问量*k=全网总访问量,即已发布t天数内的总全网访问量。2.根据权利要求1所述的互联网文档的总访问量的估值方法,其特征还在于,所述构建网站各栏目的访问量预估值计算模型包括以下过程:(1)获取alexa中各个网站近一月日均pv值及排名情况;(2)根据alexa获取的网站排名情况,在所述数据库的文档当日访问量表中,记录排名第一的网站的默认访问量预估值,并依次记录其他网站的默认访问量预估值直到记录到最低值;所述默认访问量预估值的设置根据近30天的日均pv进行计算,根据网站日均pv值与第一名网站日均pv值对比计算访问量预估值;(3)根据获取的待评估的所述互联网文档的信息,将转发过所述互联网文档的网站栏目进行整理去重,获得准确的转发过所述互联网文档的网站栏目列表,进而对所述网站栏目列表中的网站栏目做访问量预估值的初始化更新,得到所有的所述网站栏目对应的访问量预估值;(4)判断所述栏目列表中所有的所述网站栏目,是否包含首页、轮播、推荐等重点栏目名称词汇,若包含,则将得到的所述网站栏目对应的访问量预估值乘以校正系数x;若不包含,则乘以校正系数y,得到校正后的所述网站栏目对应的访问量预估值;其中,校正系数x=[1,10],校正系数y=[0.1
‑
1]。3.根据权利要求2所述的互联网文档的总访问量的估值方法,其特征还在于,所述步骤(3)具体还包括:通过访问数据库,获取所述互联网文档在各个网站的转发情况,整理成网站
‑
栏目的对应关系,将得到的对应关系处理成网站
‑
栏目列表的列表,即所述网站栏目列表;若有新的栏目出现,且不存在所述互联网文档的栏目列表中,则初始化所述新栏目访问量预估值,通过访问数据库获取所述网站栏目列表中的所有栏目的访问量预估值,得到包含新栏目的所有的所述网站栏目对应的访问量预估值。4.根据权利要求1或2或3所述的互联网文档的总访问量的估值方法,其特征还在于,根据所述网站栏目列表及校正后的所述网站栏目对应的访问量预估值进行求和,得到
的求和值即为所述互联网文档在该网站访问量预估值;最后,对所有转发过所述互联网文档的网站的访问量预估值进行求和,即为所述网站预估访问量。5.根据权利要求1所述的互联网文档的总访问量的估值方法,其特征还在于,所述构建app各栏目的访问量预估值计算模型,包括以下过程:(1)根据获取的待评估的所述互联网文档的信息,通过数据中心采集所述互联网文档在app中的转发情况,并对采集的数据进行整理去重,得到准确的转发所述互联网文档的app及app中的栏目列表;(...
【专利技术属性】
技术研发人员:黄鸿发,崔宏彩,赵冠磊,江敏,
申请(专利权)人:拓尔思信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。