一种基于多模态融合的诈骗APP的识别方法及系统技术方案

技术编号:37783722 阅读:36 留言:0更新日期:2023-06-09 09:14
本发明专利技术提出了一种基于多模态融合的诈骗APP的识别方法及系统,涉及数据分析领域。该方法通过对待测软件的APK文件进行提取元数据特征、注册语义特征、登录语义特征和开发类型特征后,基于Deep&Wide模型对其进行研判处理,从而得到最终融合特征以及特征挖掘信息进行判断待测软件是否涉嫌诈骗。该系统包括安装包获取模块、元数据提取模块、注册语义提取模块、登录语义提取模块、开发类型提取模块、研判处理和预测识别模块。总之,其通过多层次的对待测软件的APK文件进行特征提取,从而后续利用这些多维度的特征基于Deep&Wide模型进行研判,将可以实现更加准确有效的识别涉诈APP的识别目的。目的。目的。

【技术实现步骤摘要】
一种基于多模态融合的诈骗APP的识别方法及系统


[0001]本专利技术涉及数据分析领域,具体而言,涉及一种基于多模态融合的诈骗APP的识别方法及系统。

技术介绍

[0002][0003]随着移动互联网技术的发展,诈骗分子作案手段不断升级,诈骗手段已经由传统电信诈骗向新型网络诈骗转移。其中APP类诈骗呈爆发式增长,究其原因,APP诈骗具有制作成本低、更新速度快、接受门槛低、隐蔽性高等特点,以至于诈骗发展态势正在逐渐向APP端转移。而传统反诈手段只能覆盖网站类诈骗,无法适应APP类诈骗的发展态势;且传统反诈手段多依靠人工方式对诈骗网址打标,成本高且效率低,无法跟上APP类诈骗的更新周期。
[0004]目前的对诈骗APP的识别技术,一般采用包名、APP名称匹配,以及沙盒运行提取URL的方式进行分析,特征维度较少。且诈骗APP的识别不同于恶意APP的识别,恶意APP的危害性在于其通过技术手段,监控受害人手机、远程操控受害人手机、窃取受害人信息等,这些动作都是需要在技术层面通过代码实现的。而诈骗APP的危害性在于受害人通过使用APP,一步一步被诈本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于多模态融合的诈骗APP的识别方法,其特征在于,包括以下步骤:获取待测软件的APK文件;基于所述APK文件提取基础元数据特征,得到元数据特征;将所述APK文件在真机中运行,并获取注册界面截图,通过图片分类算法提取注册界面截图的语义特征,得到待测软件的注册语义特征;将所述APK文件在真机中运行,并获取登录界面截图,通过图片分类算法提取登录界面截图的语义特征,得到待测软件的登录语义特征;将所述APK文件进行反编译,得到对应的源代码,并通过自然语言处理算法提取开发类型特征,得到待测软件的开发类型特征;将元数据特征、注册语义特征、登录语义特征和开发类型特征中的所有特征进行划分为连续类特征和离散类特征,并基于划分结果分别送入Deep&Wide模型中进行研判处理,得到最终融合特征以及特征挖掘信息;基于最终融合特征判断待测软件是否涉嫌诈骗,得到诈骗预测结果信息。2.如权利要求1所述的一种基于多模态融合的诈骗APP的识别方法,其特征在于,所述将所述APK文件进行反编译,得到对应的源代码,并通过自然语言处理算法提取开发类型特征,得到待测软件的开发类型特征的步骤具体包括:通过逆向提取模型,对所述APK文件进行逆推,还原所述APK文件的源代码,得到对应的源代码信息;对源代码信息进行数据预处理,并对预处理后的源代码信息进行拼接为程序可读的文本数据,得到文本形式数据;将文本形式数据送入BERT模型进行特征提取,得到待测软件的开发类型特征。3.如权利要求1所述的一种基于多模态融合的诈骗APP的识别方法,其特征在于,所述元数据特征包括包名长度、包名字母的数量、包名数字的数量、文件大小、签名长度、APP文本命中关键词数量、APP网络交互域名数量、APP网络交互境外域名数量或APP网络交互境内域名数量中的至少一个。4.如权利要求1所述的一种基于多模态融合的诈骗APP的识别方法,其特征在于,所述注册语义特征包括手机注册、邮箱注册、用户名注册、邀请码注册、验证码注册、无注册、人脸验证、验证码验证...

【专利技术属性】
技术研发人员:罗峰卢永强谢东岳
申请(专利权)人:北京赋乐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1