当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于WAQM的网站无障碍检测最佳抽样方法技术

技术编号:14806216 阅读:89 留言:0更新日期:2017-03-15 00:42
一种基于WAQM的网站无障碍检测最佳抽样方法,在计算机系统上进行以下步骤:将待检测网站中的所有网页按照不同的深度进行分组,具有同一深度的网页聚在一组;构造网站抽样误差的期望模型;给定抽样比率r,通过最小化抽样误差的期望,计算出每层抽样网页数目;根据每层网页抽样数目,在每层中随机选择规定数目的网页组成抽样样本;对样本中的每个网页,利用机器和人工检测得到网页的无障碍得分;根据无障碍衡量标准,利用抽样的网页无障碍得分估算出整个网站的无障碍得分。本方法的优点在于:可以大幅度降低抽样误差,使抽样算法选取的样本网页能更好的反映整个网站的无障碍状况。

【技术实现步骤摘要】

本专利技术涉及面向网站无障碍检测的抽样方法的
,特别是基于WAQM的网站无障碍检测抽样方法。
技术介绍
根据第二次全国残疾人抽样调查,我国各类残疾人数为8296万,涉及2.6亿家庭人口。越来越多的残疾人使用互联网获取信息、娱乐、结识朋友,互联网已经成为残疾人日常生活的重要元素。由于残疾人的自身缺陷和大部分网站对残疾人是障碍的,残疾人在互联网信息服务获取、利用和交互等方面存在巨大的困难。因此,如何有效地发现对于残疾人有障碍的网页和快速评估一个网站的无障碍程度成为了信息无障碍领域的重要研究课题。在实际的检测过程中,由于网站无障碍检测不能完全实现机器自动检测,部分检测需要人工的干预;同时网站一般具有海量的网页,为了减少工人检测开销,对网站进行抽样后检测是必须的。目前在网站无障碍检测领域涉及的抽样算法都是泛化的,即抽样算法没有针对具体的无障碍衡量标准进行优化。但是已有的研究表明,在无障碍检测中,一个抽样算法造成的抽样误差很大程度依赖于所选择无障碍衡量标准;有些数据表明在抽样比率很大时,有的抽样算法仍然会造成20%的抽样误差,这说明了该抽样算法和该无障碍标准不匹配,即使选择了很大的样本,带来的抽样误差依然很大。
技术实现思路
本专利技术要克服现有技术的上述缺点,提出一种基于WAQM的网站无障碍检测最佳抽样方法为了降低网站无障碍检测中的抽样误差,我们提出了针对无障碍衡量标准的抽样算法。由于WAQM是目前无障碍领域常用的衡量标准,我们提出了一个针对WAQM的最优化抽样算法,该算法大大降低了抽样误差,提高了抽样质量,使抽样算法的选取的网页更好的代表了整个网站的无障碍状况。本专利技术所述的一种基于WAQM的网站无障碍检测最佳抽样方法,在计算机系统上进行以下步骤:1)将待检测网站中的所有网页按照不同的深度化分成(d+1)组,具有同一深度的网页聚在一组,其中d是该网站的最大深度,首页的深度为0;2)构造网站的抽样误差的期望模型;3)给定抽样比率r,通过最小化抽样误差的期望,计算出每层抽样网页数目;4)根据每层网页抽样数目,在每层中随机选择规定数目的网页组成抽样样本;5)利用机器和人工检测得到抽样样本中的每个网页无障碍得分;6)根据相关标准,利用网页无障碍得分计算出整个网站的无障碍得分。步骤2中所述的构造抽样误差模型,具体步骤如下:21)首先定义网页深度为从该网站的首页跳转该网页的最小跳数,首页深度设为0;22)假设一个网站最大的深度为d(d≥0),那么可以将该网站的所有n个网页按照深度分成(d+1)层,具有同一深度的网页聚类在一层,每层网页的个数分别为n0,n1,n2,n3,…nd,且23)计算每层网页的抽样误差的期望。假设抽样算法得到的每层网页个数分别为n0′n1′,n2′,…nd′,则在第i(0≤i≤d)层,该层所有网页分数的平均值为ui,该层抽样网页的平均分数为ui′,那么第i层网页的抽样误差的期望为E[errori]=E[|ui-u′i|](公式1);24)根据WAQM标准,计算整个网站共(d+1)层的抽样误差的期望,即其中ni表示第i层网页的总个数,wi表示第i层网页的权重,一般wi取值为wi=e-i;25)最小化网站的抽样误差的期望,即步骤3所述的最小化网站的抽样误差的期望,得出每层抽样网页数目,具体是:31)最小化网站的抽样误差的期望和最小化是等同的,将公式(4)作为最终优化函数;32)每个网页的得分为pi,由于所有网页都是独立的,服从IID分布,假设方差都为σi(0≤i≤d),可以做如下变化:33)将公式(5)带入公式(4),可以得到转化后的优化函数34)针对公式(6),可以将其看做成以下的组合优化问题,其中每层的抽样数目n0′,n1′,n2′,…nd′是需要求解的参数,定义N′={n0′,n1′,n2',…nd′本文档来自技高网...

【技术保护点】
一种基于WAQM的网站无障碍检测最佳抽样方法,在计算机系统上进行以下步骤:1)将待检测网站中的所有网页按照不同的深度化分成d+1组,具有同一深度的网页聚在一组,其中d是该网站的最大深度,首页的深度为0;2)构造网站的抽样误差的期望模型;3)给定抽样比率r,通过最小化抽样误差的期望,计算出每层抽样网页数目;4)根据每层网页抽样数目,在每层中随机选择规定数目的网页组成抽样样本;5)对样本中的每个网页,利用机器和人工检测得到网页的无障碍得分;6)根据无障碍衡量标准,利用抽样样本中的网页无障碍得分估算出整个网站的无障碍得分。

【技术特征摘要】
1.一种基于WAQM的网站无障碍检测最佳抽样方法,在计算机系统上进行以下步骤:
1)将待检测网站中的所有网页按照不同的深度化分成d+1组,具有同一深度的网页聚
在一组,其中d是该网站的最大深度,首页的深度为0;
2)构造网站的抽样误差的期望模型;
3)给定抽样比率r,通过最小化抽样误差的期望,计算出每层抽样网页数目;
4)根据每层网页抽样数目,在每层中随机选择规定数目的网页组成抽样样本;
5)对样本中的每个网页,利用机器和人工检测得到网页的无障碍得分;
6)根据无障碍衡量标准,利用抽样样本中的网页无障碍得分估算出整个网站的无障碍
得分。
2.如权利要求1所述的网站无障碍检测方法,其特征在于:步骤2中所述的构造抽样误
差的期望模型,步骤如下:
21)首先定义网页深度为从该网站的首页跳转该网页的最小跳数,首页深度设为0;
22)假设一个网站最大的深度为d(d≥0),那么可以将该网站的所有n个网页按照深度
分成(d+1)层,具有同一深度的网页聚类在一层,每层网页的个数分别为n0,n1,n2,n3,…nd,
且23)计算每层网页的抽样误差的期望。假设抽样算法得到的每层网页个数...

【专利技术属性】
技术研发人员:王灿卜佳俊张梦妮于智王炜
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1