当前位置: 首页 > 专利查询>南京大学专利>正文

一种基于SAM大模型的移动应用GUI页面布局结构生成方法技术

技术编号:43473890 阅读:28 留言:0更新日期:2024-11-27 13:13
本发明专利技术公开了一种基于SAM大模型的移动应用GUI页面布局结构生成方法,包括:步骤1)输入一个移动应用GUI界面截图,使用OCR模型进行预处理;步骤2)利用SAM大模型将GUI界面截图进行元素区域的像素级分割;步骤3)设计形状识别算法,识别界面中的矩形和非矩形区域;步骤4)设计不规则区域合并算法,将界面中的非矩形区域进行合并;步骤5)设计树状结构生成算法,根据分割结果生成布局的树状结构;步骤6)使用图神经网络对树状结构的节点进行分类,得到GUI界面组件的结构和类别;本方法可以为给定的移动应用GUI截图生成相应的树状布局结构,其中每个节点都与GUI页面上的一个可见元素相对应,便于用户在无布局文件的情况下理解移动应用GUI界面的结构。

【技术实现步骤摘要】

本专利技术涉及移动应用的gui页面组件识别,特别涉及一种基于sam大模型的移动应用gui页面布局结构生成方法。


技术介绍

1、移动应用的gui布局理解对于对许多gui自动化和gui测试任务至关重要,获取图形用户界面元素的准确位置和类别也是进行图形用户界面逆向工程或图形用户界面测试的第一步。移动应用的gui界面与一颗布局树一一对应,树中的节点对应gui界面中的一个组件,节点中标识了gui组件的类别、位置等属性,树中的节点的父子关系反应了gui界面组件的嵌套关系,及父节点在位置坐标上包含子节点。

2、理解完整的移动应用的gui界面对许多的下游任务具有重要的意义,目前的gui界面理解技术可以分为基于深度学习的方法和基于传统图像处理的方法两类。基于深度学习的方法在一个标注的数据集上训练一个识别模型,之后利用该模型来对新的数据进行识别,然而该方案依赖于数据集的质量和数量,而数据标注的成本十分高,数据集的不足会严重影响所训练的模型的效果。基于传统图像处理的方法利用传统的边缘检测、洪水覆盖等算法,对gui页面的组件进行识别,然而传统的图像处理方法依赖于许多预本文档来自技高网...

【技术保护点】

1.一种基于SAM大模型的移动应用GUI页面布局结构生成方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的基于SAM大模型的移动应用GUI页面布局结构生成方法,其特征在于,所述步骤1)使用OCR模型预处理GUI页面截图包括以下步骤:

3.根据权利要求1所述的基于SAM大模型的移动应用GUI页面布局结构生成方法,其特征在于,所述步骤2)使用SAM分割模型对GUI区域进行像素级分割的过程包括以下步骤:

4.根据权利要求1所述的基于SAM大模型的移动应用GUI页面布局结构生成方法,其特征在于,所述步骤3)设计形状识别算法,识别界面中的矩形和非矩...

【技术特征摘要】

1.一种基于sam大模型的移动应用gui页面布局结构生成方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的基于sam大模型的移动应用gui页面布局结构生成方法,其特征在于,所述步骤1)使用ocr模型预处理gui页面截图包括以下步骤:

3.根据权利要求1所述的基于sam大模型的移动应用gui页面布局结构生成方法,其特征在于,所述步骤2)使用sam分割模型对gui区域进行像素级分割的过程包括以下步骤:

4.根据权利要求1所述的基于sam大模型的移动应用gui页面布局结构生成方法,其特征在于,所述步骤3)设计形状识别算法,识别界面中的矩形和非矩形区域的具体实现过程包括以下...

【专利技术属性】
技术研发人员:张天潘敏学付诚
申请(专利权)人:南京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1