System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 网页访问数据统计方法、系统、设备及存储介质技术方案_技高网

网页访问数据统计方法、系统、设备及存储介质技术方案

技术编号:41212215 阅读:3 留言:0更新日期:2024-05-09 23:35
本申请公开了一种网页访问数据统计方法、系统、设备及存储介质,方法包括:获取目标数据平台的网页访问数据,提取网页访问数据中的访问特征信息,访问特征信息包括网页点击次数、网页停留时间和网页访问频率;基于网页访问数据获取对应的用户登录类型信息,将网页访问数据输入至预设的访问行为判断模型;在预设的访问行为判断模型中基于对应的用户登录类型信息选择对应的访问行为判断规则;根据对应的访问行为判断规则对网页访问数据进行访问行为分析,得到不同的行为分析结果;基于不同的行为分析结果对网页访问数据进行数据筛选处理得到访问数据统计结果;本申请具有提高网页访问数据统计结果的准确度的效果。

【技术实现步骤摘要】

本申请涉及网页访问数据统计,尤其是涉及一种网页访问数据统计方法、系统、设备及存储介质


技术介绍

1、随着计算机技术发展,数字化图书馆在全民阅读的信息化建设中也发挥着重要助力作用;目前在图书馆的数字化阅读应用中,图书馆管理人员需要统计不同类型书籍如学术期刊、论文的访问阅读量,以便于为图书馆未来的决策、规划的指定等提供理论依据。

2、现有的图书馆的网页访问数据统计是根据点击次数来计算访问数量的,而其中存在一些点击进去某些网页,但是并没有浏览,也将该访问数据纳入计数范畴,或者是存在同一个人短时间多次浏览同一个网页,而将每次的浏览都进行累计计数的情况,因而针对此种网页访问数据的统计方式统计出的数据具有一定的失真性,存在网页访问数据统计结果的准确度较低的缺陷,需要进行改进。


技术实现思路

1、为了提高网页访问数据统计结果的准确度,本申请提供一种网页访问数据统计方法、系统、设备及存储介质。

2、第一方面,本申请的专利技术目的采用如下技术方案实现:

3、网页访问数据统计方法,包括:

4、获取目标数据平台的网页访问数据,提取所述网页访问数据中的访问特征信息,所述访问特征信息包括网页点击次数、网页停留时间和网页访问频率;

5、基于所述网页访问数据获取对应的用户登录类型信息,将所述网页访问数据输入至预设的访问行为判断模型;在所述预设的访问行为判断模型中基于所述对应的用户登录类型信息选择对应的访问行为判断规则;

6、根据所述对应的访问行为判断规则对所述网页访问数据进行访问行为分析,得到不同的行为分析结果;

7、基于所述不同的行为分析结果对所述网页访问数据进行数据筛选处理得到访问数据统计结果。

8、通过采用上述技术方案,目标数据平台为需要进行网页访问数据的不同类型的数据化管理平台,例如图书馆中对数字化阅读行为进行数据统计的数据管理平台;在实际应用过程中,先获取目标数据平台的网页访问数据,此时的网页访问数据为指定时间段内的初步的网页访问总统计数据,接着提取网页访问数据中的访问特征信息,以得到阅读用户的网页点击次数、网页停留时间和网页访问频率等的用户访问行为信息;在实际应用时,由于个人登录账号的账户在登录上时比较容易判断其是否存在访问造假的行为,而对于短时间登录的游客账号和多人一起使用的群体账号则较难判断,因而对于绑定用户个人的个人登录账号、游客账号和学校群体的群体登录账号可制定不同的访问行为判断规则,以提高对用户访问行为判断的准确度;具体地,通过访问行为判断模型基于用户登录类型信息选择对应的访问行为判断规则后,通过访问行为判断规则对网页访问数据进行用户行为判断分析,以得到行为分析结果,行为分析结果包括正常的访问行为和异常的访问行为,对于异常的访问行为需要对该网页访问数据进行筛选和/或数据去重处理(即数据筛选处理),以得到最终的访问数据统计结果,由于访问数据统计结果对一些用户异常访问行为进行筛选和去重处理,因而能够大大提高网页访问数据统计结果的准确度,有利于提高网页访问数据统计作业的效率。

9、本申请在一较佳示例中:所述基于所述网页访问数据获取对应的用户登录类型信息,将所述网页访问数据输入至预设的访问行为判断模型之后,还包括:

10、基于所述网页访问数据获取对应的网页停留时间,依据所述预设的访问行为判断模型中的时长判断规则将所述网页停留时间分别与第一时长阈值和第二时长阈值进行比较,其中第一时长阈值小于第二时长阈值;

11、当所述网页停留时间小于第一时长阈值时,将对应的所述网页访问数据划分为无效访问数据;当所述网页停留时间大于第二时长阈值时,获取同一网页在指定时间段内的网页点击次数和对应的用户登录类型信息;

12、当同一网页的所述对应的用户登录类型信息一致时,将所述同一网页的网页点击次数超过预设的点击次数阈值的对应的网页访问数据划分为重复访问数据;

13、在所述访问行为判断模型中,过滤所述网页访问数据中的无效访问数据;并对所述重复访问数据进行去重处理。

14、通过采用上述技术方案,将网页上的网页停留时间与第一时长阈值和第二时长阈值进行比对可初步筛选出访问行为异常的网页访问数据,如网页误点之后立马关闭,或点进去之后长时间停留的刷访问率的行为等;具体地,第一时长阈值和第二时长阈值可根据实际的网页的内容阅读时长进行确定,如网页a的页面内容在阅读完后需要至少15分钟等;为了筛选出访问行为异常的网页访问数据,提高网页数据统计的准确度;依据访问行为判断模型中预设的时长判断规则判断,将网页停留时间与第一时长阈值、第二时长阈值进行比较,以判断是否存在阅读时长过短或过长的行为。

15、如网页访问数据的网页停留时间小于第一时长阈值时,则表示当前网页用户阅读时长过短(如网页停留时间小于15s时,则表征当前网页的总阅读时长小于15s),存在误点或刷访问量的行为,将此网页访问数据判断为无效访问数据;如网页访问数据的网页停留时间大于第二时长阈值时,则表示当前网页阅读时长过长(如网页停留时间大于4小时时,则表征当前网页的总阅读时长大于4小时),存在误点后没有及时关闭的或可能刷访问率的可疑,接着获取同一用户在同一网页的网页点击次数,当同一用户在同一网页的网页点击次数超过点击次数阈值时,则表明同一页面内容点击次数重复,将此网页访问数据划分为重复访问数据,以在后续对重复访问数据进行去重处理;将无效数据去除,重复数据进行去重处理,有利于初步筛选出访问行为明显异常的网页访问数据,便于筛选出异常的网页访问数据,时长判断规则简单快速,有利于减少访问行为判断模型的计算量。

16、本申请在一较佳示例中:所述用户登录类型信息包括第一用户类型和第二用户类型;在所述预设的访问行为判断模型中基于所述对应的用户登录类型信息选择对应的访问行为判断规则,具体包括:

17、预设的访问行为判断模型包括第一行为判断规则和第二行为判断规则;

18、在所述预设的访问行为判断模型中基于所述对应的用户登录类型信息中的第一用户类型选择第一行为判断规则;

19、在所述预设的访问行为判断模型中基于所述对应的用户登录类型信息中的第二用户类型选择第二行为判断规则。

20、通过采用上述技术方案,图书馆用以管理网页访问数据的平台中,即在目标数据平台中,包括多种用户登录类型,如游客登录类型、已注册用户登录类型、群体管理账号登录类型等,具体地,将具有具体用户信息的注册用户登录类型设为第一用户类型;将用户信息不明确的游客登录类型和群体管理账号类型设为第二用户类型;基于不同的用户登录类型信息选择相对应的访问行为判断规则,有利于对不同的用户进行行为细化判断;示例性的,基于第一用户类型可判断用户在指定的时间周期内,是否存在刷访问率的行为,如用户每隔4小时,点击同一网页后,隔断时间再次刷新点击的这类刷访问率的行为,同时对于需要统计长时间段(如一个月)的同一网页内的网页访问数据进行统计时,可判断在一个月的时间本文档来自技高网...

【技术保护点】

1.网页访问数据统计方法,其特征在于,包括:

2.根据权利要求1所述的网页访问数据统计方法,其特征在于,所述基于所述网页访问数据获取对应的用户登录类型信息,将所述网页访问数据输入至预设的访问行为判断模型之后,还包括:

3.根据权利要求1所述的网页访问数据统计方法,其特征在于,所述用户登录类型信息包括第一用户类型和第二用户类型;在所述预设的访问行为判断模型中基于所述对应的用户登录类型信息选择对应的访问行为判断规则,具体包括:

4.根据权利要求3所述的网页访问数据统计方法,其特征在于,所述根据所述对应的访问行为判断规则对所述网页访问数据进行访问行为分析,得到不同的行为分析结果,具体包括:在识别到所述网页访问数据的用户登录类型为第一用户类型时,根据所述第一行为判断规则对所述网页访问数据进行访问行为分析;

5.根据权利要求3所述的网页访问数据统计方法,其特征在于,所述第二用户类型的网页停留时间设置有短时停留阈值;所述根据所述对应的访问行为判断规则对所述网页访问数据进行访问行为分析,得到不同的行为分析结果,还包括:

6.根据权利要求1所述的网页访问数据统计方法,其特征在于,还包括:

7.网页访问数据统计系统,其特征在于,包括:

8.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述用于网页访问数据统计方法的步骤。

9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述用于网页访问数据统计方法的步骤。

...

【技术特征摘要】

1.网页访问数据统计方法,其特征在于,包括:

2.根据权利要求1所述的网页访问数据统计方法,其特征在于,所述基于所述网页访问数据获取对应的用户登录类型信息,将所述网页访问数据输入至预设的访问行为判断模型之后,还包括:

3.根据权利要求1所述的网页访问数据统计方法,其特征在于,所述用户登录类型信息包括第一用户类型和第二用户类型;在所述预设的访问行为判断模型中基于所述对应的用户登录类型信息选择对应的访问行为判断规则,具体包括:

4.根据权利要求3所述的网页访问数据统计方法,其特征在于,所述根据所述对应的访问行为判断规则对所述网页访问数据进行访问行为分析,得到不同的行为分析结果,具体包括:在识别到所述网页访问数据的用户登录类型为第一用户类型时,根据所述第一行为判断规则对所述网页访问数据进行访问行为分析;

<...

【专利技术属性】
技术研发人员:彭海涛杨亮谢桂圆丘嘉城易晨晟
申请(专利权)人:广东技术师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1