一种基于深度学习的移动应用截图来源识别方法和系统技术方案

技术编号:43540363 阅读:31 留言:0更新日期:2024-12-03 12:22
本公开提供一种基于深度学习的移动应用截图来源识别方法和系统,涉及人工智能领域。方法包括数据采集和模型构建与训练两个步骤:数据采集步骤构建移动应用样本库;模型构建与训练步骤包括四个步骤:步骤1,改进MobileNetV3网络并构建相应损失函数形成改进的MobileNetV3‑Large网络;步骤2,利用设置的对比损失函数训练内核参数,得到训练好的移动应用匹配模型;步骤3,移动应用样本库中的图片进行处理;步骤4,利用所述训练好的移动应用匹配模型,计算所述特定特征与移动应用特征库中的每个特征的欧式距离,得到所有欧氏距离中的最小值,如果低于阈值,则返回与之对应的移动应用名称,能够持续实现对最新移动应用的准确识别能力。

【技术实现步骤摘要】

本公开涉及人工智能领域,更具体地讲,涉及一种基于深度学习的移动应用截图来源识别方法和系统


技术介绍

1、市场上的app数量呈爆炸性增长,不同的app在功能、用户界面(ui)设计、图标样式等方面都有着各自的特点和风格。用户在使用app时,经常需要分享屏幕截图来讨论app的功能、表达对设计的看法或分享app所承载的信息内容。这些截图蕴含着来源信息,对监测和分析市场上各种app的变化和趋势以及对信息的溯源和跟踪有着至关重要的作用。截图来源识别现有的解决方案主要依赖于手动搜索或基于文本的元数据识别,这种方法效率低下,而且容易受到截图中不含可识别文本或元数据不完整等因素的限制。

2、随着人工智能技术,通过深度学习技术手段自动识别app截图成为可能,使用的图像分类技术可以达到这个目的,但app的种类一直在变化,即图像的类别一直在变化,传统图像分类技术需要不断的更新模型来支持新的移动应用类别。

3、本公开旨在解决当前移动应用截图来源识别现有技术的不足的技术问题。


技术实现思路

1、本公开的实施例的本文档来自技高网...

【技术保护点】

1.一种基于深度学习的移动应用截图来源识别方法,其特征在于,包括数据采集和模型构建与训练两个步骤:

2.如权利要求1所述的一种基于深度学习的移动应用截图来源识别方法,其特征在于,所述构建移动应用样本库的具体方法为:首先通过软件监控市面上大型主流的渠道分发平台,采集应用名称、发布厂商、应用描述、应用大小、应用版本、应用截图、下载量的应用元数据信息,并定时刷新采集系统更新的数据;

3.如权利要求2所述的一种基于深度学习的移动应用截图来源识别方法,其特征在于,所述预处理包括:图像灰度化、图像锐化、图像剪裁、图像镜像、图像旋转、图像模糊、图像涂抹、图像增加文字中一种或几种...

【技术特征摘要】

1.一种基于深度学习的移动应用截图来源识别方法,其特征在于,包括数据采集和模型构建与训练两个步骤:

2.如权利要求1所述的一种基于深度学习的移动应用截图来源识别方法,其特征在于,所述构建移动应用样本库的具体方法为:首先通过软件监控市面上大型主流的渠道分发平台,采集应用名称、发布厂商、应用描述、应用大小、应用版本、应用截图、下载量的应用元数据信息,并定时刷新采集系统更新的数据;

3.如权利要求2所述的一种基于深度学习的移动应用截图来源识别方法,其特征在于,所述预处理包括:图像灰度化、图像锐化、图像剪裁、图像镜像、图像旋转、图像模糊、图像涂抹、图像增加文字中一种或几种的组合。

4.如权利要求3所述的一种基于深度学习的移动应用截图来源识别方法,其特征在于,所述改进的mobilenetv3-large网络结构为:输入三元组<x,x+,x->,其中x为训练时迭代的样本,x+是随机选取的与x相同的app截图,x-则为随机选取与x不同app的截图;

5.如权利要求4所述的一种基于深度学习的移动应用截图来源识别方法,其特征在于,所述mobilenetv3-sim包括输入层、15个改进的e-bneck结构和输出层,并构建新的损失函数,模型接收一个3通道的图像作为输入,所述输入层为448*448像素,输入图像首先经过一个卷积层将通道数从3增加到16,并且通过步长为4的卷积核进行下采样,并通过批量归一化和h-swish激活函数后,得到输入层结果;在经过15个改进的e-bneck结构处理后,进入输出层;所述输出层使用一个1x1的卷积混合不同尺度的特征,并通过批量归一化和h-swish激活函数进一步处理;然后使用一个7*7全局平均池化层,将每个特征图下采样为一个1*1*960维单一的输出值;最后通过一个1*1卷积层,批量归一化和h-swish激活函数,将池化后的输出变换到1*1*1280高维的空间,并使用一个参数为0.2的dropout进行正则化。

6.如权利要求5所述的一种基于深度学习的移动应用截图来源识别方法,其特征在于,所述改进的e-bneck结构包含1个卷积核是1*1的卷积操作、批量归一化、h-swish激活函数,一个卷积核尺寸为n,步长为1或2的深度卷积操作、批量归一化、h-swish激活函数和一个卷积核为1*1的逐点卷积操作,批量归一化和h-swish激活函数,还包括增加空间的注意力权重机制的ca注意力机制模块。

7.如权利要求6所述的一种基于深度学习的移动应用截图来源识别方法,其特征在于,所述15个改进的e-bneck的参数如下:第一个e-bneck的输入为112*112*16,卷积核大小:3、膨胀尺寸为:16、输出通道数为:16、步长为:1、激活函数采用relu;第二个e-bneck的输入为112*112*16,卷积核大小:3、膨胀尺寸为:64、输出通道数为:24、步长为:2、激活函数采用relu;第三个e-bneck的输入为56*...

【专利技术属性】
技术研发人员:杨春孙伟淳
申请(专利权)人:北京科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1