一种基于趋势算法的网站内容关注度的预测方法和装置制造方法及图纸

技术编号:34623027 阅读:9 留言:0更新日期:2022-08-20 09:30
本发明专利技术公开了一种基于趋势算法的网站内容关注度的预测方法和装置,包括:获取网站内容访问量统计数据,所述统计数据的来源包括第三方数据获取接口;流量数据分类处理,包括对网站流量访问地址进行分类;数据拟合计算,获得拟合结果,其中数据拟合计算支持计算趋势斜率K值;根据所述拟合结果,生成报表显示。本发明专利技术通过最小二乘法(又称最小平方法),预先计算网站流量趋势,通过监控用户访问趋势K线图,预警用户流失趋势,提前部署解决方案,解决了网站用户流失问题。站用户流失问题。站用户流失问题。

【技术实现步骤摘要】
一种基于趋势算法的网站内容关注度的预测方法和装置


[0001]本专利技术涉及计算机及互联网内容运营领域,具体而言,涉及了一种基于趋势算法的网站内容关注度的预测方法和装置。

技术介绍

[0002]医学健康科普是一种内容型互联网产品,主要为用户提供内容服务。这些内容规模往往数以亿计,如此庞大的内容离不开运营,而内容运营方向的把握离不开内容流量走向的监控,所以如何有效判断内容流量趋势至关重要。原有的内容帖发布后,需要随时监控帖子访问量,通过用户反馈方式获取发帖内容的用户访问量,当访问量下降,说明发帖内容关注度下降,需要及时更新发帖内容。运营人员通过后台统计数据在数量庞大的各个版块监控由用户反馈的帖子访问量制定帖子的后期更新内容。这样的操作带来的问题是,当帖子访问量下跌以后再更新内容就会使得用户流失严重。因此,需要一种方法及时计算网站内容的访问量,即需要及时监控和预测网站内容的关注度。

技术实现思路

[0003]为了解决以上问题,本专利技术提供了一种基于趋势算法的网站内容关注度的预测方法的监控方案,通过最小二乘法(又称最小平方法),预先计算网站流量趋势,通过监控用户访问趋势K线图,以便于及时预警用户流失趋势,提前部署解决方案,解决了网站用户流失问题。
[0004]本申请提供的基于趋势算法的网站内容关注度的预测方法,包括:
[0005]获取网站内容访问量统计数据,统计数据的来源包括第三方数据获取接口;
[0006]流量数据分类处理,包括对网站流量访问地址进行分类;
[0007]数据拟合计算,获得拟合结果,其中数据拟合计算支持计算趋势斜率K值;
[0008]根据所述拟合结果,生成报表显示。
[0009]其中,流量数据分类处理,包括:
[0010]建立PV值分类表,将PV值分类与统计页面的title建立映射关系;
[0011]分类识别操作,执行读取页面title脚本,生成PV值分类数据。
[0012]进一步的,数据拟合计算,包括:
[0013]获取拟合列表数据,列表数据由PV值分类表获取;
[0014]趋势斜率拟合,使用趋势拟合算法计算网站访问流量趋势K线斜率。
[0015]其中,趋势斜率拟合采用最小二乘法曲线进行拟合计算,计算方式为多元函数求偏导的方法来计算函数的极小值,计算PV值最佳拟合K线斜率,计算公式为其中L为拟合结果集,y
t
为真实值,f(x
t
)为预测值。
[0016]进一步,最小二乘法曲线拟合计算还包括拟合计算阈值操作,使用预设阈值过滤偶然误差和系统误差数据;
[0017]其中,最小二乘法曲线拟合计算和阈值操作,包括第三方算法库实现。
[0018]其中,拟合结果,包括操作系统任务执行脚本获取。
[0019]其中,生成报表显示,支持使用浏览器显示趋势K线结果图表。
[0020]另一方面,本专利技术提供了一种基于趋势算法的网站内容关注度的预测装置,包括:
[0021]流量收集组件,用于从第三方网站获取网站流量统计;
[0022]页面访问分类组件,用于操作系统定时器执行分类脚本;
[0023]页面趋势计算组件,用于执行Python脚本计算页面趋势分类;
[0024]报表输出组件,用于前端浏览器显示输出趋势统计结果。
[0025]其中,页面访问分类组件,包括从页面内容title获取分类标识。
[0026]进一步的,页面趋势计算组件,其中计算组件由Python脚本实现。
[0027]本专利技术提供的一种基于趋势算法的网站内容关注度监控方法和装置,通过最小二乘法(又称最小平方法),预估帖子访问量发展趋势,提前预警页面访问量,预防用户流失。解决了后期统计帖子流量方法的用户流失严重问题。
附图说明
[0028]图1是根据本专利技术实施例提供的基于趋势算法的网站内容关注度监控方法的方法步骤图;
[0029]图2是根据本专利技术实施例提供的基于趋势算法的网站内容关注度监控方法的数据拟合步骤图;
[0030]图3是根据本专利技术实施例提供的基于趋势算法的网站内容关注度监控装置结构图;
[0031]图4是根据本专利技术实施例提供的基于趋势算法的网站内容关注度监控和装置的PV值分类表图;
[0032]图5是根据本专利技术实施例提供的基于趋势算法的网站内容关注度监控方法的趋势预测拟合原理图;
[0033]图6是根据本专利技术实施例提供的基于趋势算法的网站内容关注度监控方法的趋势报表样例图;
[0034]图7是根据本专利技术实施例提供的基于趋势算法的网站内容关注度监控方法的分类映射表图;
[0035]图8是根据本专利技术实施例提供的基于趋势算法的网站内容关注度监控方法的百度统计表数据结构图;
[0036]图9是根据本专利技术实施例提供的基于趋势算法的网站内容关注度监控方法的趋势报表结构图;
具体实施方式
[0037]下面结合说明书附图对本专利技术的具体实现方式做详细描述。
[0038]为了解决运营人员通过后期统计数据制定发帖内容。致使帖子访问流失严重问题,本专利技术提供的一种基于趋势算法的网站内容关注度监控方法和装置,通过最小二乘法(又称最小平方法),预先计算网站流量趋势,通过监控用户访问趋势K线图,便于预警用户流失趋势,提前部署解决方案,预防网站用户流失问题。
[0039]如图1所示,本专利技术提供的一种基于趋势算法的内容运营方法。包括,S1100:获取网站内容访问量统计数据;S1200:对流量数据分类处理;S1300:数据拟合计算,获得拟合结果;S1400:根据拟合结果,生成报表显示。
[0040]本实施例方法实施前,需要由开发人员在mysql库里建立PV值分类表、分类映射表、百度统计表、趋势报表。
[0041]S1100:获取网站内容访问量统计数据。网站内容访问量统计通常方法是在网站的每一个页面的onload函数内增加访问统计数器,当访问页面时统计计数器增加计数值并发送到指定统计接口,统计的实现支持自行统计和第三方统计。本实施例使用第三方的百度统计,每日的帖子访问量由百度统计回调接口写到本实施例的百度统计表,见图8。
[0042]S1200:流量数据分类处理。百度统计表给出的统计是每个页面访问量的PV统计数据,需要本实施例中进行分类处理,见图8。百度统计表的链接地址和网站的页面的类别没有关联,本实施例的实现中,由脚本开发人员设置在需要统计页面的title标识域设置,当统计时读取title内容和本实施例中的库表建立关联。统计数据和本实施例中的分类列表建立映射关联。映射关联步骤包括,S2110:建立PV值分类表。S2120:分类识别操作。
[0043]S2110:建立PV值分类表。本实施例中建立PV值分类表方法是在MySQL库中建立,由运营人员通过管理网站对本实施例的网站内容进行分类配置。
[0044]表结构有类别、父类,是一个二维表结构。类别对应于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于趋势算法的网站内容关注度的预测方法,其特征在于,包括:获取网站内容访问量统计数据,所述统计数据的来源包括第三方数据获取接口;流量数据分类处理,包括对网站流量访问地址进行分类;数据拟合计算,获得拟合结果,其中数据拟合计算支持计算趋势斜率K值;根据所述拟合结果,生成报表显示。2.根据权利要求1所述的基于趋势算法的网站内容关注度的预测方法,其特征在于,所述流量数据分类处理,包括:建立PV值分类表,将所述PV值分类与统计页面的title建立映射关系;分类识别操作,执行读取页面title脚本,生成PV值分类表数据。3.根据权利要求1所述的基于趋势算法的网站内容关注度的预测方法,其特征在于,所述数据拟合计算,包括:获取拟合列表数据,所述列表数据由所述PV值分类表获取;趋势斜率拟合,使用趋势拟合算法计算网站访问流量趋势K线斜率。4.根据权利要求3所述的基于趋势算法的网站内容关注度的预测方法,其特征在于,所述趋势斜率拟合采用最小二乘法曲线进行拟合计算,所述计算方式为多元函数求偏导的方法来计算函数的极小值,计算所述PV值最佳拟合K线斜率,所述计算公式为其中L为拟合结果集,yt为真实值,f(xt)为预测值。5.根...

【专利技术属性】
技术研发人员:高瑞雪欧锦华田丹李晓鹏梁鸿亮陈冲唐鸣泽何焕翠
申请(专利权)人:广州启生信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1