The present invention relates to a device and method for selecting Web pages from applications including multiple web pages. According to the invention of the selected web device includes: a page acquisition unit for a plurality of web access applications; feature set of elements determining unit for determining the set of elements of each web page features multiple pages; similarity determination unit for each element according to the characteristics of web pages set multiple pages in each of the two a web page similarity; dividing unit, according to the similarity of each two page multiple pages into one or more \combination; and a selection unit for selecting the access frequency of a web page with the highest pages from each combination of one or more\ in combination. Using the device and method of selecting pages from an application containing multiple web pages according to the invention, the classification of web pages can be reliably realized, and the highest access frequency pages can be selected from them.
【技术实现步骤摘要】
用于选取网页的装置和方法
本专利技术涉及应用程序测试
,具体地涉及用于从包括多个网页的应用程序中选取网页的装置和方法。
技术介绍
这个部分提供了与本专利技术有关的背景信息,这不一定是现有技术。如今,移动互联网随着智能手机和3G/4G网络的快速发展变得越来越繁荣,并且人们逐渐开始使用智能手机。随着智能手机的发展,智能手机等移动终端上安装的应用程序(app)也层出不穷,发展迅猛。具体来看,当前的应用程序可以分为三类:一种是原生应用程序(nativeapp),一般依托于操作系统,有很强的交互性,是一个完整的应用程序,可拓展性强,并且需要用户下载安装使用;第二种是网页应用程序(webapp),其采用Html5(HypertextMarkupLanguage5,超文本标记语言第5次修改)语言编写,不需要下载安装,生存在浏览器中,类似于现在所说的轻应用程序,也可以说是触屏版的网页应用程序,例如用智能手机打开搜狐等网站;第三种是混合应用程序(hybridapp),指的是半原生半网页类型的混合应用程序,其需要下载安装,看上去类似原生应用程序,但访问的内容是网页。目前,人们在 ...
【技术保护点】
一种从包括多个网页的应用程序中选取网页的装置,包括:网页获取单元,用于获取所述应用程序的多个网页;特征元素集合确定单元,用于确定所述多个网页中的每个网页的特征元素集合;相似度确定单元,用于根据所述每个网页的特征元素集合确定所述多个网页中的每两个网页的相似度;划分单元,用于根据所述每两个网页的相似度将所述多个网页分为一个或多个网页组合;以及选取单元,用于从所述一个或多个网页组合的每个网页组合中选取接入频率最高的一个网页。
【技术特征摘要】
1.一种从包括多个网页的应用程序中选取网页的装置,包括:网页获取单元,用于获取所述应用程序的多个网页;特征元素集合确定单元,用于确定所述多个网页中的每个网页的特征元素集合;相似度确定单元,用于根据所述每个网页的特征元素集合确定所述多个网页中的每两个网页的相似度;划分单元,用于根据所述每两个网页的相似度将所述多个网页分为一个或多个网页组合;以及选取单元,用于从所述一个或多个网页组合的每个网页组合中选取接入频率最高的一个网页。2.根据权利要求1所述的装置,其中,所述特征元素集合确定单元包括:元素获取单元,用于获取所述每个网页的多个元素;以及确定单元,用于根据所述多个元素中每两个元素的相似度确定所述每个网页的特征元素,并且将所述特征元素的集合作为所述每个网页的特征元素集合。3.根据权利要求2所述的装置,其中,所述确定单元用于:根据所述多个元素中每两个元素的相似度将所述多个元素划分为一个或多个元素组;从所述一个或多个元素组的每个元素组中选取一个元素;以及将选取的元素作为所述网页的特征元素。4.根据权利要求3所述的装置,其中,所述确定单元根据元素的位置、类型和元素所在网页的DOM树结构来确定所述多个元素中每两个元素的相似度。5.根据权利要求1所述的装置,其中,所述相似度确定单元包括:特征元素对确定单元,用于确定所述两个网页的特征元素对,所述特征元素对由所述两个网页中的一个网页的一个特征元素和另一个网页的一个特征元素组成;计算单元,用于计算所述特征元素对中的两个元素的相似度并将其作为所述特征元素对的相似度;以及求和单元,用于将所述两个网页的所有特征元素对的相似度的和作为所述两个网页的相似度。6.根据权利要求5所述的装置,其中,所述计算单元根据所述特征元素对中的两个元素中的每个元素的位置、属性和树结构信息计算所述特征元素对中的两个元素的相似度。7.根据权利要求1所述的装置,其中,所述划分单元包括:判断单元,...
【专利技术属性】
技术研发人员:马磊,皮冰锋,孙俊,
申请(专利权)人:富士通株式会社,
类型:发明
国别省市:日本,JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。