一种用于网页间访问的页面聚合方法技术

技术编号:27140860 阅读:18 留言:0更新日期:2021-01-27 21:10
本发明专利技术提供了一种用于网页间访问的页面聚合方法。获取网页中的目标元素,对所述目标元素进行标记和特征提取,获取元素标记和元素特征;根据所述元素标记,确定所述目标元素的网页数据;将所述网页数据进行聚合转化,确定聚合转化后的目标页面;根据所述元素特征对所述目标页面进行验证,当验证无误时,展示所述目标页面。目标页面。目标页面。

【技术实现步骤摘要】
一种用于网页间访问的页面聚合方法


[0001]本专利技术涉及互联网
,特别涉及一种用于网页间访问的页面聚合方法。

技术介绍

[0002]目前,在互联网上进行信息浏览时,因为不同的网站的信息是不同的,因此在信息浏览时,打开那个网页只能看那个网页的资料,如果需要进行资料的对比,只能通过分屏或者先看一个网页,再看一个网页,再就是把资料下载下来,然后整合之后,在进行信息浏览,十分的不便。例如:在不同的网站进行买衣服,就无法同时直观性的观看对比两件衣服;或者在查询学术资料时,两个资料同时在两个不同的资源网站,不能在观看时不能直接将两个资源网站的资料设置在一个页面上进行观看,导致在不同的网页,网站之间浏览、对比产品或数据资料十分不便。而且,在现有技术中,能进行商品对比的也是只能在同一个网站之间,但是不同网站的网页之间就无法进行对比。

技术实现思路

[0003]本专利技术提供一种用于网页间访问的页面聚合方法,用以解决
技术介绍
中提出的情况。
[0004]一种用于网页间访问的页面聚合方法,其特征在于,包括:
[0005]获取网页中的目标元素,对所述目标元素进行标记和特征提取,获取元素标记和元素特征;
[0006]根据所述元素标记,确定所述目标元素的网页数据;
[0007]将所述网页数据进行聚合转化,确定聚合转化后的目标页面;
[0008]根据所述元素特征对所述目标页面进行验证,当验证无误时,展示所述目标页面。
[0009]作为本专利技术的一种实施例:所述获取网页中的目标元素,对所述目标元素进行标记和特征提取,获取元素标记和元素特征,包括:
[0010]当检测到用户的网页触发行为,确定当前网页中的触发节点;
[0011]根据所述触发节点,确定所述网页中的目标元素;
[0012]对所述目标元素通过代码进行标记,确定所述目标元素的标记文档和元素链接地址;
[0013]根据所述标记文档和元素链接地址,确定所述元素特征;其中,
[0014]所述元素特征包括:
[0015]根据所述元素链接地址确定的地址特征;
[0016]根据所述目标元素的标记文档确定的文本特征、图片特征、视频特征、表格特征或声音特征。
[0017]作为本专利技术的一种实施例:所述获取网页中的目标元素,对所述目标元素进行标记和特征提取,获取元素标题和元素特征,还包括:
[0018]根据当前用户的触发行为,获取触发结果;
[0019]根据所述触发结果判断所述目标元素的元素属性;其中,
[0020]所述元素属性包括文本属性、图片属性、视频属性、表格属性或声音属性;
[0021]根据所述元素属性,生成对应的属性代码;
[0022]根据所述属性代码,生成所述目标元素以属性代码标记;
[0023]根据所述属性代码标记,分类提取目标元素的元素特征。
[0024]作为本专利技术的一种实施例:所述获取网页中的目标元素,对所述目标元素进行标记和特征提取,获取元素标题和元素特征,还包括:
[0025]根据用户的第N网页触发行为,对所述第N网页中的第N目标元素进行标记,获取对第N目标元素标记的第N标记文档;其中,
[0026]所述N>1;
[0027]分别提取N个文档中N个目标元素的元素特征;
[0028]综合所述N个目标元素的特征,构成元素特征。
[0029]作为本专利技术的一种实施例:所述根据所述元素标记,确定所述目标元素的网页数据,包括:
[0030]获取所述元素标记,根据所述元素标记的代码,确定所述目标元素的元素属性;
[0031]根据所述元素属性,识别网页中的目标元素;
[0032]获取网页的原始结构信息,确定所述目标元素的网页数据。
[0033]6.根据权利要求1所述的一种用于网页间访问的页面聚合方法,其特征在于,所述将所述网页数据进行聚合转化,确定聚合转化后的目标页面,包括:
[0034]响应用户的聚合触发行为,提取所述网页数据中的目标元素,并确定所述目标元素的占用空间;
[0035]根据所述占用空间,在预设的本地页面中对所述目标元素的存储区域进行划分;
[0036]在所述存储区域分配完成后,将所述目标元素存储到对应的存储区域,再通过预设的页面排版方式,将所述目标元素在所述本地页面中进行排版,在排版完成后,形成所述目标页面;
[0037]其中,所述预设的页面排版方式包括自主排版和默认排版。
[0038]作为本专利技术的一种实施例:所述将所述网页数据进行聚合转化,确定聚合转化后的目标页面,还包括:
[0039]获取所述目标元素在所述网页上的地址信息;
[0040]根据所述地址信息,在所述本地页面上建立所述目标元素与所述网页中目标元素的链接路径;
[0041]在所述链接路径确定后,形成所述目标页面。
[0042]作为本专利技术的一种实施例:所述再通过预设的页面排版方式,将所述目标元素在所述本地页面中进行排版,包括:
[0043]当收到用户的排版方式触发行为时,选择自主排版方式进行排版;其中,
[0044]当选择所述自主排版时,所述用户可以移动、调换所述目标元素在所述本地页面中的位置;
[0045]当没有收到用户的排版方式触发行为时,选择默认排版方式进行排版。
[0046]作为本专利技术的一种实施例:所述根据所述元素特征对所述目标页面进行验证,当
验证无误时,展示所述目标页面,包括:
[0047]提取所述目标页面的目标特征,根据所述目标特征构建所述目标页面的验证模型;
[0048]将所述元素特征导入所述验证模型,判断所述目标特征是否与所述元素特征是否一致;
[0049]当所述目标特征与所述元素特征不一致时,验证有误,获取错误元素特征与目标特征的链接地址,根据所述链接地址判断所述元素特征错误或目标特征错误,并对所述目标页面进行修改;
[0050]当所述目标特征与所述元素特征一致时,验证无误,展示所述目标页面。
[0051]作为本专利技术的一种实施例:所述将所述元素特征导入所述验证模型,判断所述目标特征是否与所述元素特征是否一致,包括:
[0052]步骤1:获取所述目标特征的集合A;
[0053]A={a1,a2,L,a
n
};
[0054]其中,a
i
为所述目标特征集合A中的第i个目标特征,i的取值为从1到n,n为所述目标特征集合A中的目标特征的总数目;
[0055]步骤2:根据所述目标特征的集合A,构建验证模型F;
[0056][0057]其中,所述y
i
表示训练集合;所述k(a
i
)表示所述目标特征的集合A的预测函数;所述C表示待验证集合;所述c
i
为所述待验证集合C中的第i个特征;所述所述k(c
i
)表示所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于网页间访问的页面聚合方法,其特征在于,包括:获取网页中的目标元素,对所述目标元素进行标记和特征提取,获取元素标记和元素特征;根据所述元素标记,确定所述目标元素的网页数据;将所述网页数据进行聚合转化,确定聚合转化后的目标页面;根据所述元素特征对所述目标页面进行验证,当验证无误时,展示所述目标页面。2.根据权利要求1所述的一种用于网页间访问的页面聚合方法,其特征在于,所述获取网页中的目标元素,对所述目标元素进行标记和特征提取,获取元素标记和元素特征,包括:当检测到用户的网页触发行为,确定当前网页中的触发节点;根据所述触发节点,确定所述网页中的目标元素;对所述目标元素通过代码进行标记,确定所述目标元素的标记文档和元素链接地址;根据所述标记文档和元素链接地址,确定所述元素特征;其中,所述元素特征包括:根据所述元素链接地址确定的地址特征;根据所述目标元素的标记文档确定的文本特征、图片特征、视频特征、表格特征或声音特征。3.根据权利要求1所述的一种用于网页间访问的页面聚合方法,其特征在于,所述获取网页中的目标元素,对所述目标元素进行标记和特征提取,获取元素标题和元素特征,还包括:根据当前用户的触发行为,获取触发结果;根据所述触发结果判断所述目标元素的元素属性;其中,所述元素属性包括文本属性、图片属性、视频属性、表格属性或声音属性;根据所述元素属性,生成对应的属性代码;根据所述属性代码,生成所述目标元素以属性代码标记;根据所述属性代码标记,分类提取目标元素的元素特征。4.根据权利要求1所述的一种用于网页间访问的页面聚合方法,其特征在于,所述获取网页中的目标元素,对所述目标元素进行标记和特征提取,获取元素标题和元素特征,还包括:根据用户的第N网页触发行为,对所述第N网页中的第N目标元素进行标记,获取对第N目标元素标记的第N标记文档;其中,所述N>1;分别提取N个文档中N个目标元素的元素特征;综合所述N个目标元素的特征,构成元素特征。5.根据权利要求1所述的一种用于网页间访问的页面聚合方法,其特征在于,所述根据所述元素标记,确定所述目标元素的网页数据,包括:获取所述元素标记,根据所述元素标记的代码,确定所述目标元素的元素属性;根据所述元素属性,识别网页中的目标元素;获取网页的原始结构信息,确定所述目标元素的网页数据。
6.根据权利要求1所述的一种用于网页间访问的页面聚合方法,其特征在于,所述将所述网页数据进行聚合转化,确定聚合转化后的目标页面,包括:响应用户的聚合触发行为,提取所述网页数据中的目标元素,并确定所述目标元素的占用空间;根据所述占用空间,在预设的本地页面中对所述目标元素的存储区域进行划分;在所述存储区域分配完成后,将所述目标元素存储到对应的存储区域,再通过预设的页面排版方式,将所述目标元素在所述本地页面中进行排版,在排版完成后,形成所述目标页面;其中,所述预设的页面排版方式包括自主排版和默认排版。7.根据权利要求1所述的一种用于网页间访问的页面聚合方法...

【专利技术属性】
技术研发人员:李月梅
申请(专利权)人:广州五子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1