应用聚类方法、装置、存储介质及计算机设备制造方法及图纸

技术编号:40536657 阅读:40 留言:0更新日期:2024-03-01 13:58
本申请公开一种应用聚类模型的训练方法,该方法利用人工智能技术:获取训练样本对;通过图像编码网络对训练样本对进行图像编码,得到第一特征矩阵和第二特征矩阵;基于第一特征矩阵和第二特征矩阵进行对比特征提取,得到第三特征矩阵和第四特征矩阵,及基于第一特征矩阵和第二特征矩阵进行聚类特征提取,得到第五特征矩阵和第六特征矩阵;基于第三特征矩阵和第四特征的确定第一损失与基于第五特征矩阵和第六特征矩阵确定的第二损失对网络参数进行迭代更新,直至达到训练结束条件。通过联合第一损失和第二损失训练出的应用聚类模型可准确学习出各应用对应的特征表示,以提升基于该特征表示的聚类准确性,从而提高对不同应用进行类型识别的准确度。

【技术实现步骤摘要】

本申请涉及人工智能,更具体地,涉及一种应用聚类方法、装置、存储介质及计算机设备


技术介绍

1、应用软件是指为了某种特定的用途而被开发的计算机软件。应用软件可以是特定的程序或者具有互相协作能力的程序集合。随着信息技术的发展,应用软件的使用场景和应用功能也越来越多。用户可以根据自身需求通过不同的网络途径下载应用软件。

2、根据用户和服务领域提供的不同功能,应用软件可以是一个特定的程序,例如部署在移动终端上的社交app。也可以是一组功能联系紧密,能够互相协作的程序集合,例如部署在电脑上的办公软件,或者由众多独立程序组成的庞大的数据库管理系统。

3、针对网络上存在较多劣质应用(也即,非法或违规的应用软件)的情况,现有技术会对下载的应用软件进行检测识别,例如,对应用软件进行逆向脱壳分析、提取应用软件模拟运行的内容,然而,这些方法无法做到对应用软件进行准确地检测识别。


技术实现思路

1、本申请实施例提供一种应用聚类方法、装置、存储介质以及计算机设备。以解决相关技术中无法对应用软件进行准确地检测识本文档来自技高网...

【技术保护点】

1.一种应用聚类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述应用聚类模型包括图像编码网络、文本编码网络和特征提取网络;所述通过所述应用聚类模型基于每个所述待测应用的运行截图进行应用聚类,确定所述待测应用集对应的聚类结果,包括:

3.根据权利要求1或2所述的方法,其特征在于,所述通过所述文本编码网络对各待测应用的运行截图对应的文本信息进行文本编码,得到各待测应用对应的目标文本特征,包括:

4.根据权利要求1或2所述的方法,其特征在于,所述特征提取网络包括对比网路和聚类网络;所述通过所述特征提取网络对各待测应用的合并特征...

【技术特征摘要】

1.一种应用聚类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述应用聚类模型包括图像编码网络、文本编码网络和特征提取网络;所述通过所述应用聚类模型基于每个所述待测应用的运行截图进行应用聚类,确定所述待测应用集对应的聚类结果,包括:

3.根据权利要求1或2所述的方法,其特征在于,所述通过所述文本编码网络对各待测应用的运行截图对应的文本信息进行文本编码,得到各待测应用对应的目标文本特征,包括:

4.根据权利要求1或2所述的方法,其特征在于,所述特征提取网络包括对比网路和聚类网络;所述通过所述特征提取网络对各待测应用的合并特征进行对比特征提取,得到各待测应用对应的第一应用特征,通过所述特征提取网络对各待测应用的合并特征进行聚类特征提取,得到各待测应用对应的第二应用特征,包括:

5.根据权利要求1至4任一项所述的方法,其特征在于,所述聚类结果包括预设数量的聚类簇;所述基于所述第一应用特征和所述第二应用特征进行聚类,得到所述待测应用集对应的聚类结果,包括:

6.根据权利要求1所述的方法,其特征在于,所述方法还包括:

7.一种应用聚类模型的训练方法,其特征在于,所述应用聚类模型包括图像编码网络和特征提取网络,所述方法包括:

8.根据权利要求7所述的方法,其特征在于,所述基于所述第三特征矩阵和所述第四特征矩阵,确定所述训练样本对中两个图像间的对比相似度,并基于所述对比相似度确定第一损失,包括:

9.根据权利要求8所述的方法,其特征在于,所述第三特征矩阵包括第一对比特征向量和第二对比特征向量;所述第四特征矩阵包括第三对比特征向量和第四对比特征向量;所述第一对比特征向量在所述第三特征矩阵中的元素位置与所述第三对比特征向量在所述第四特征矩阵中的元素位置相同;所述...

【专利技术属性】
技术研发人员:郝立扬
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1