【技术实现步骤摘要】
模型训练方法、装置及电子设备
[0001]本申请属于机器学习
,具体涉及一种模型训练方法、装置及电子设备。
技术介绍
[0002]目前,电子设备可以使用训练后的分类模型,识别应用程序是否为恶意广告应用程序,并在识别该应用程序为恶意广告应用程序的情况下拦截该应用程序,以避免用户使用该应用程序。在相关技术中,在训练分类模型的过程中,电子设备可以采用监督训练方式,根据多个应用程序特征,对待训练的分类模型进行模型训练,以得到训练后的分类模型。
[0003]但是,由于可能会出现多个应用程序特征未覆盖某些应用程序特征的情况,这样可能会出现训练后的分类模型无法识别某些应用程序是否为恶意广告应用程序的情况,因此,导致电子设备识别恶意广告应用程序的识别率较低。
技术实现思路
[0004]本申请实施例的目的是提供一种模型训练方法、装置及电子设备,能够解决电子设备识别恶意广告应用程序的识别率较低的问题。
[0005]第一方面,本申请实施例提供了一种模型训练方法,该方法包括:根据N个应用程序的目标程序文件,确定M个目标特征图像,该目标程序文件为安卓安装包APK中的程序文件,该N个应用程序中的每个应用程序的目标程序文件分别对应至少两个目标特征图像,N、M均为正整数;将M个目标特征图像输入至预训练模型中,得到输出的L个目标样本图像,该预训练模型是采用无监督训练方式进行模型训练得到的,L为大于M的正整数;基于L个目标样本图像,对待训练的分类模型进行模型训练,得到目标分类模型。
[0006]第二方面,本 ...
【技术保护点】
【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:根据N个应用程序的目标程序文件,确定M个目标特征图像,所述目标程序文件为安卓安装包APK中的程序文件,所述N个应用程序中的每个应用程序的目标程序文件分别对应至少两个目标特征图像,N、M均为正整数;将所述M个目标特征图像输入至预训练模型中,得到输出的L个目标样本图像,所述预训练模型是采用无监督训练方式进行模型训练得到的,L为大于M的正整数;基于所述L个目标样本图像,对待训练的分类模型进行模型训练,得到目标分类模型。2.根据权利要求1所述的方法,其特征在于,所述M个目标特征图像包括P个第一特征图像和T个第二特征图像;每个应用程序的目标程序文件分别对应至少一个第一特征图像,每个应用程序的目标程序文件分别对应至少一个第二特征图像;P、T均为正整数;所述根据N个应用程序的目标程序文件,确定M个目标特征图像,包括:根据所述N个应用程序的目标程序文件,确定所述P个第一特征图像;根据所述P个第一特征图像中对应有分类标签的特征图像,对待训练的Q个第一预设模型进行模型训练,Q为大于1的正整数;将所述P个第一特征图像分别输入至训练后的所述Q个第一预设模型中,得到输出的所述T个第二特征图像;其中,所述P个第一特征图像包括以下至少一项:根据所述N个应用程序的目标程序文件得到的特征图像、根据N个应用程序的应用程序编程接口API得到的特征图像;在所述Q个第一预设模型中,不同第一预设模型对应的算法不同。3.根据权利要求2所述的方法,其特征在于,在所述P个第一特征图像包括根据所述N个应用程序的目标程序文件得到的特征图像的情况下,所述P个第一特征图像包括N个第三特征图像;每个应用程序的目标程序文件分别对应一个第三特征图像;所述根据所述N个应用程序的目标程序文件,确定所述P个第一特征图像,包括:根据所述N个应用程序的目标程序文件,生成所述N个第三特征图像,所述N个第三特征图像和所述N个应用程序一一对应。4.根据权利要求3所述的方法,其特征在于,所述N个应用程序包括第一应用程序,所述第一应用程序的目标程序文件包括R个子文件,R为大于1的正整数;所述根据所述N个应用程序的目标程序文件,生成所述N个第一特征图像,包括:根据所述R个子文件,生成R个子特征图像,所述R个子特征图像和所述R个子文件一一对应;依次拼接所述R个子特征图像,得到第四特征图像,所述第四特征图像为:所述N个第三特征图像中,与所述第一应用程序对应的特征图像。5.根据权利要求3所述的方法,其特征在于,所述P个第一特征图像还包括N个第五特征图像;每个应用程序的目标程序文件分别对应一个第五特征图像;在所述根据所述N个应用程序的目标程序文件,生成所述N个第三特征图像之后,所述方法还包括:针对所述N个第三特征图像中的每个第三特征图像,确定一个第三特征图像中的S个图像区域的S个目标信息熵,所述S个目标信息熵和所述S个图像区域一一对应,S为正整数;基于所述S个目标信息熵,生成一个第五特征图像,以生成所述...
【专利技术属性】
技术研发人员:段云欣,吴怡,陈辉,刘陶,杜云,
申请(专利权)人:中国信息通信研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。