一种基于WAQM的网站无障碍检测最佳抽样方法技术

技术编号：14806216 阅读：89 留言：0更新日期：2017-03-15 00:42

一种基于WAQM的网站无障碍检测最佳抽样方法，在计算机系统上进行以下步骤：将待检测网站中的所有网页按照不同的深度进行分组，具有同一深度的网页聚在一组；构造网站抽样误差的期望模型；给定抽样比率r，通过最小化抽样误差的期望，计算出每层抽样网页数目；根据每层网页抽样数目，在每层中随机选择规定数目的网页组成抽样样本；对样本中的每个网页，利用机器和人工检测得到网页的无障碍得分；根据无障碍衡量标准，利用抽样的网页无障碍得分估算出整个网站的无障碍得分。本方法的优点在于：可以大幅度降低抽样误差，使抽样算法选取的样本网页能更好的反映整个网站的无障碍状况。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及面向网站无障碍检测的抽样方法的
，特别是基于WAQM的网站无障碍检测抽样方法。
技术介绍
根据第二次全国残疾人抽样调查，我国各类残疾人数为8296万，涉及2.6亿家庭人口。越来越多的残疾人使用互联网获取信息、娱乐、结识朋友，互联网已经成为残疾人日常生活的重要元素。由于残疾人的自身缺陷和大部分网站对残疾人是障碍的，残疾人在互联网信息服务获取、利用和交互等方面存在巨大的困难。因此，如何有效地发现对于残疾人有障碍的网页和快速评估一个网站的无障碍程度成为了信息无障碍领域的重要研究课题。在实际的检测过程中，由于网站无障碍检测不能完全实现机器自动检测，部分检测需要人工的干预；同时网站一般具有海量的网页，为了减少工人检测开销，对网站进行抽样后检测是必须的。目前在网站无障碍检测领域涉及的抽样算法都是泛化的，即抽样算法没有针对具体的无障碍衡量标准进行优化。但是已有的研究表明，在无障碍检测中，一个抽样算法造成的抽样误差很大程度依赖于所选择无障碍衡量标准；有些数据表明在抽样比率很大时，有的抽样算法仍然会造成20％的抽样误差，这说明了该抽样算法和该无障碍标准不匹配，即使选择了很大的样本，带来的抽样误差依然很大。
技术实现思路
本专利技术要克服现有技术的上述缺点，提出一种基于WAQM的网站无障碍检测最佳抽样方法为了降低网站无障碍检测中的抽样误差，我们提出了针对无障碍衡量标准的抽样算法。由于WAQM是...

【技术保护点】
一种基于WAQM的网站无障碍检测最佳抽样方法，在计算机系统上进行以下步骤：1)将待检测网站中的所有网页按照不同的深度化分成d+1组，具有同一深度的网页聚在一组，其中d是该网站的最大深度，首页的深度为0；2)构造网站的抽样误差的期望模型；3)给定抽样比率r，通过最小化抽样误差的期望，计算出每层抽样网页数目；4)根据每层网页抽样数目，在每层中随机选择规定数目的网页组成抽样样本；5)对样本中的每个网页，利用机器和人工检测得到网页的无障碍得分；6)根据无障碍衡量标准，利用抽样样本中的网页无障碍得分估算出整个网站的无障碍得分。

【技术特征摘要】
1.一种基于WAQM的网站无障碍检测最佳抽样方法，在计算机系统上进行以下步骤：
1)将待检测网站中的所有网页按照不同的深度化分成d+1组，具有同一深度的网页聚
在一组，其中d是该网站的最大深度，首页的深度为0；
2)构造网站的抽样误差的期望模型；
3)给定抽样比率r，通过最小化抽样误差的期望，计算出每层抽样网页数目；
4)根据每层网页抽样数目，在每层中随机选择规定数目的网页组成抽样样本；
5)对样本中的每个网页，利用机器和人工检测得到网页的无障碍得分；
6)根据无障碍衡量标准，利用抽样样本中的网页无障碍得分估算出整个网站的无障碍
得分。
2.如权利要求1所述的网站无障碍检测方法，其特征在于：步骤2中所述的构造抽样误
差的期望模型，步骤如下：
21)首先定义网页深度为从该网站的首页跳转该网页的最小跳数，首页深度设为0；
22)假设一个网站最大的深度为d(d≥0)，那么可以将该网站的所有n个网页按照深度
分成(d+1)层，具有同一深度的网页聚类在一层，每层网页的个数分别为n0,n1,n2,n3,…nd，
且23)计算每层网页的抽样误差的期望。假设抽样算法得到的每层网页个数...

【专利技术属性】
技术研发人员：王灿，卜佳俊，张梦妮，于智，王炜，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人