基于视觉分析的屏幕页面结构解析与路径存储方法及系统技术方案

技术编号:37332936 阅读:36 留言:0更新日期:2023-04-21 23:10
本发明专利技术涉及计算机技术领域,具体涉及基于视觉分析的屏幕页面结构解析与路径存储方法及系统。方法包括:S1,对图像进行灰度化,将边缘划分为阶跃边缘和屋顶边缘;S2,对阶跃边缘和屋顶边缘分别求取一阶、二阶导数,获得页面块的边缘和角点的特征信息;S3,对获得的页面块的边缘和角点的特征信息进行膨胀处理;S4,对处理后的页面块信息做连通域处理,获取每个页面块的具体位置并还原每个页面块的真实信息;S5,对所有页面块进行排序;S6,对页面块两两计算交并比,完成页面块的关系判断;S7,采用树形结构对所有页面块进行存储。本发明专利技术具有能够高效、准确、鲁棒的进行页面结构解析和结构路径存储的特点。路径存储的特点。路径存储的特点。

【技术实现步骤摘要】
基于视觉分析的屏幕页面结构解析与路径存储方法及系统


[0001]本专利技术涉及计算机
,具体涉及基于视觉分析的屏幕页面结构解析与路径存储方法及系统。

技术介绍

[0002]目前,随着互联网的高速发展,各种互联网页面已经成为这个世界上最大的信息来源。互联网页面作为海量信息的载体已成为人们重要的工作、学习、生活、娱乐工具。页面信息的相关发展给人类生活带来了巨大的方便,人们可以跨越时间和空间界限来共享大量信息。但是如何去获取这些页面信息则是大家面临的共同问题。在最基本的层次上,整个互联网的界面就是由无数的页面而构成,因此如果获取了这些页面结构信息就相当于获取了信息的基本结构。
[0003]但是把整个页面作为一个基本的信息获取单位并不是太合理,尽管用户通常会把一些相关的内容放在同一页面中,但是大多数情况下,一个页面中通常会包含不止一类的主题,比如在页面中,可能包含体育类信息,可能包含健康类信息,也可能包含广告,导航链接等信息。这些信息分布在整个页面的不同位置。网页页面结构可以通过HTML(超文本标记语言,HyperText Markup 本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于视觉分析的屏幕页面结构解析与路径存储方法,其特征在于,包括如下步骤;S1,对图像进行灰度化,根据灰度变化的剧烈程度,将边缘划分为阶跃边缘和屋顶边缘;S2,对阶跃边缘和屋顶边缘分别求取一阶、二阶导数,获得页面块的边缘和角点的特征信息;S3,对步骤S2中获得的页面块的边缘和角点的特征信息进行膨胀处理,得到处理后的页面块信息;S4,对处理后的页面块信息做连通域处理,获取每个页面块的具体位置并还原每个页面块的真实信息;S5,按照从左到右,从上到下对所有页面块进行排序;S6,对排序完的所有页面块两两计算交并比,完成页面块的关系判断;S7,采用树形结构对所有页面块进行存储。2.根据权利要求1所述的基于视觉分析的屏幕页面结构解析与路径存储方法,其特征在于,步骤S1中所述边缘为图像中在灰度级为8级的情况下,连续三个像素点灰度一阶导数为大于1的区域;所述阶跃边缘两边的灰度值从连续的0级直接跨越到连续的7级;所述屋顶边缘位于灰度值增加与减少的交界处。3.根据权利要求1所述的基于视觉分析的屏幕页面结构解析与路径存储方法,其特征在于,步骤S2包括如下步骤:S21,设计卷积核如下所示:;其中,为横向卷积核,为竖向卷积核;S22,对于一幅图像,对应的二阶微分定义为:;其中,代表偏导数,x代表横向,y代表竖向;得到的页面块的线为连续两次对横向做偏导以及连续两次对竖向做偏导并叠加;得到的页面块角点信息为先对横向做偏导后对竖向做偏导以及先对竖向做偏导后做横向偏导,并进行叠加;S23,对步骤S22得到的边和角信息,进行过滤,并对过滤后的边和角信息进行或运算,最终得到页面块的边缘和角点的特征信息。4.根据权利要求3所述的基于视觉分析的屏幕页面结构解析与路径存储方法,其特征在于,步骤S4中,所述连通域采用的卷积核与步骤S21中采用的卷积核相同。5.根据权利要求4所述的基于视觉分析的屏幕页面结构解析与路径存储方法,其特征在于,步骤S6中交并比的计算方式如下:;
其中,IOU代表两个页面块的交并比,...

【专利技术属性】
技术研发人员:周神特
申请(专利权)人:杭州实在智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1