一种基于ViLT的图文多模态的安卓App涉诈研判分类方法技术

技术编号：41075570 阅读：2 留言：0更新日期：2024-04-24 11:33

本发明专利技术提供一种基于ViLT的图文多模态的安卓App涉诈研判分类方法，采用多模态的ViLT模型从DEX文件提取视觉特征，同时还利用Androidmanifest.xml文件提取权限和意图特征作为ViLT模型的另一部分输入与图像特征进行融合；通过将图像特征和文本特征结合，ViLT模型能够学习到App文件的多模态表示；在训练过程中，使用标记的涉诈和非涉诈App文件作为训练样本，通过优化模型参数，使得模型能够准确地区分涉诈和非涉诈的App。本发明专利技术利用ViLT模型将App文件转化为图片并提取权限和意图特征，从而实现了对涉诈App的准确判别；具有较高的判别能力和准确性，可以有效提高移动应用市场的安全性；可以实现快速、高效且准确的移动App涉诈骗判别，对保护用户信息和维护移动互联网秩序具有重要意义。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机恶意软件检测或处理，具体涉及一种基于vilt的图文多模态的安卓app涉诈研判分类方法。

技术介绍

1、在移动互联网时代下，安卓app的使用量不断增加，但是也面临着越来越多的安全隐患。其中一大隐患是涉诈骗app的存在，这些app以虚假宣传、欺诈违法等手段骗取用户的个人信息、财产等，给用户造成巨大损失。

2、因此，研究如何快速、准确地对安卓app的涉诈判别成为了当下迫切需要解决的问题。目前，人工审查恶意app的成本过高，无法满足大规模应用，传统的基于静态分析和基于动态行为分析的方法也面临着识别准确率低、易被规避等问题。

3、基于此，多模态技术成为了涉诈判别的新思路。多模态技术将图像、语音、文本等多种数据融合起来进行建模，使得模型具有更全面的认知能力。

4、因此，需要一种多模态融合的安卓app的涉诈判别方法。

技术实现思路

1、本专利技术是为了解决安卓app的涉诈判别准确率低、易被规避等问题，提供一种基于vilt的图文多模态的安卓app涉诈研判分类方法，该方法通过采集app的文件将其转化为图片，通过androidmanifest.xml提取权限和意图特征；为了进一步提高判别准确性在该方法中，采用了多模态的vilt模型，vilt模型能够从图像中提取视觉特征，例如dex文件等，同时，还利用androidmanifest.xml文件提取权限和意图特征。通过解析该文件，可以获取app所申请的权限以及声明的意图，如发送短信、访问联系人等；这些

2、本专利技术提供一种基于vilt的图文多模态的安卓app涉诈研判分类方法，包括以下步骤：

3、s1、采集安卓包并合并得到涉诈样本集合，对涉诈样本集合进行数据清洗，只保留反编译成功的样本，然后进行文本特征提取得到文本特征向量，对dex文件进行图像特征提取得到图像特征；

4、涉诈样本集合中包括涉诈app和非涉诈app；

5、图像特征通过将dex文件转换为图片后使用计算机视觉技术从图片中提取视觉特征得到；

6、文本特征向量的提取方法为：分析androidmanifest.xml文件的提取权限和意图特征并统计重要程度后得到初步涉诈文本权限特征和初步涉诈文本意图特征，再将初步涉诈文本权限特征和初步涉诈文本意图特征与omnidroid数据集中json文件的意图特征和权限特征作比较后指示每个实例中是否存在特定的android意图或android权限，然后连接成多维特征向量得到文本特征向量；

7、s2、使用vilt算法将提图像特征和文本特征向量进行多模态特征融合得到全面特征表示的输出向量p；

8、s3、根据步骤s1、s2的过程使用vilt算法建立识别和分类模型，并使用vilt算法、输出向量p进行模型训练，得到训练好的研判分类模型；

9、s4、针对新的app样本，利用训练好的研判分类模型进行测试，判断涉诈性质并给出涉诈类别，一种基于vilt的图文多模态的安卓app涉诈研判分类方法完成。

10、本专利技术所述的一种基于vilt的图文多模态的安卓app涉诈研判分类方法，作为优选方式，步骤s1包括以下步骤：

11、s11、从网络上采集涉诈安卓包和良性安卓包，将涉诈安卓包和良性安卓包进行标记并合并得到涉诈样本集合，将涉诈样本集合中的apk样本进行特征提取和特征向量化处理，得到涉诈样本集合；

12、s12、对涉诈样本集合中的apk数据进行数据清洗，使用apktool进行反编译，去除编译失败的样本、保留编译成功的样本；

13、s13、分析涉诈样本集合中的androidmanifest.xml文件并判断是否可提取权限特征和意图特征，如果是，则提取权限特征和意图特征，统计出现频次较高的权限特征和意图特征得到初步涉诈文本权限特征和初步涉诈文本意图特征；

14、如果否，则去除未能提取权限特征和意图特征的样本；

15、s14、通过解析、映射、矩阵和转换将涉诈样本集合中的dex文件转换为图像特征；

16、s15、将初步涉诈文本权限特征和初步涉诈文本意图特征与从omnidroid数据集中json文件提取的意图特征和权限特征进行比较后对初步涉诈文本权限特征和初步涉诈文本意图特征赋予权重，并将前m个初步涉诈文本权限特征和前n个初步涉诈文本意图特征连接成m+n维特征向量后使用二进制编码保存得到文本特征向量，文本特征向量指示每个实例中是否存在特定的android意图或android权限。

17、本专利技术所述的一种基于vilt的图文多模态的安卓app涉诈研判分类方法，作为优选方式，步骤s11中，安卓包包括从android平台的androzoo以及virusshare数据集中获取的涉诈app的apk和从应用商店获取的非涉诈app的apk，通过对apk样本进行特征提取和特征向量化处理得到涉诈样本集合。

18、本专利技术所述的一种基于vilt的图文多模态的安卓app涉诈研判分类方法，作为优选方式，步骤s14包括以下步骤：

19、s141、循环遍历涉诈样本集合中的dex文件，读取文件内容并计算文件的熵、字节码和代码段数量；

20、s142、将计算得到的熵、字节码和代码段数量映射到0-255范围内的整数，分别代表红、绿和蓝通道；

21、s143、创建一个numpy数组，将映射后的通道值组合起来得到图像矩阵；

22、s144、将图像矩阵重塑为指定的画布大小得到图像对象并保存为png格式的文件，得到图像特征。

23、本专利技术所述的一种基于vilt的图文多模态的安卓app涉诈研判分类方法，作为优选方式，步骤s141中，熵为：

24、

25、其中xi为第i个字节出现的次数，p(xi)为第i个字节出现的概率；

26、如果计算过程中字节数为0，则的值定义为0，熵的范围是[0,8]；

27、步骤s142中，将熵值映射到[0,255]的范围内的整数。

28、本专利技术所述的一种基于vilt的图文多模态的安卓app涉诈研判分类方法，作为优选方式，步骤s15中，omnidroid数据集为平衡数据集，由从多个真实恶意软件和良性android应用程序中提本文档来自技高网...

【技术保护点】

1.一种基于ViLT的图文多模态的安卓App涉诈研判分类方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的一种基于ViLT的图文多模态的安卓App涉诈研判分类方法，其特征在于：

3.根据权利要求2所述的一种基于ViLT的图文多模态的安卓App涉诈研判分类方法，其特征在于：

4.根据权利要求2所述的一种基于ViLT的图文多模态的安卓App涉诈研判分类方法，其特征在于：

5.根据权利要求4所述的一种基于ViLT的图文多模态的安卓App涉诈研判分类方法，其特征在于：

6.根据权利要求2所述的一种基于ViLT的图文多模态的安卓App涉诈研判分类方法，其特征在于：

7.根据权利要求1所述的一种基于ViLT的图文多模态的安卓App涉诈研判分类方法，其特征在于：步骤S2包括以下步骤：

8.根据权利要求1所述的一种基于ViLT的图文多模态的安卓App涉诈研判分类方法，其特征在于：步骤S3中，所述识别和分类模型可进行步骤S1和步骤S2的处理；

9.根据权利要求1所述的一种基于ViLT的图文多模态

10.根据权利要求1所述的一种基于ViLT的图文多模态的安卓App涉诈研判分类方法，其特征在于：步骤S4中，当所述训练好的研判分类模型进行测试时未能达到设定的准确率目标时，返回步骤S1，调整样本和模型参数，重新进行训练。

...

【技术特征摘要】

1.一种基于vilt的图文多模态的安卓app涉诈研判分类方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的一种基于vilt的图文多模态的安卓app涉诈研判分类方法，其特征在于：

3.根据权利要求2所述的一种基于vilt的图文多模态的安卓app涉诈研判分类方法，其特征在于：

4.根据权利要求2所述的一种基于vilt的图文多模态的安卓app涉诈研判分类方法，其特征在于：

5.根据权利要求4所述的一种基于vilt的图文多模态的安卓app涉诈研判分类方法，其特征在于：

6.根据权利要求2所述的一种基于vilt的图文多模态的安卓app涉诈研判分类方法，其特征在于：

7.根据权利要求1...

【专利技术属性】
技术研发人员：林飞，李大伟，易永波，古元，毛华阳，华仲峰，
申请(专利权)人：北京亚鸿世纪科技发展有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人