恶意应用的检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号：38712441 阅读：5 留言：0更新日期：2023-09-08 14:55

本公开提供了一种恶意应用的检测方法、装置、电子设备及存储介质，涉及移动网络安全、以及人工智能等技术领域。具体实现方案包括：获取待检测的应用的资源文件字符串；基于所述资源文件字符串，获取所述应用的多个第一特征词；获取所述多个第一特征词中各第一特征词的恶意分值；基于各所述第一特征词的恶意分值，检测所述应用是否为恶意应用。本公开的技术，能够有效地提高恶意应用检测的准确性和检测效率。效率。效率。

全部详细技术资料下载

【技术实现步骤摘要】
恶意应用的检测方法、装置、电子设备及存储介质

[0001]本公开涉及计算机
，具体涉及移动网络安全、以及人工智能等
，尤其涉及一种恶意应用的检测方法、装置、电子设备及存储介质。

技术介绍

[0002]随着移动终端的使用普及，涌现出越来越多的移动终端上安装和使用的应用(Application；App)，其中，一些恶意的App也呈现飞速增长的态势。所以，恶意App的检测是一项非常重要的技术，能够对恶意App进行有效检测，并做出相应的安全预警。
[0003]现有技术中，恶意App的检测，可以包括：获取已安装App的用户的反馈，并对已安装该App的用户的反馈进行分析，确定该App是否为恶意App。

技术实现思路

[0004]本公开提供了一种恶意应用的检测方法、装置、电子设备及存储介质。
[0005]根据本公开的一方面，提供了一种恶意应用的检测方法，包括：
[0006]获取待检测的应用的资源文件字符串；
[0007]基于所述资源文件字符串，获取所述应用的多个第一特征词；
[0008]获取所述多个第一特征词中各第一特征词的恶意分值；
[0009]基于各所述第一特征词的恶意分值，检测所述应用是否为恶意应用。
[0010]根据本公开的另一方面，提供了一种恶意应用的检测装置，包括：
[0011]字符串获取模块，用于获取待检测的应用的资源文件字符串；
[0012]特征词获取模块，用于基于所述资源文件字符串，获取所述应用的多个第一特征词；<...

【技术保护点】

【技术特征摘要】
1.一种恶意应用的检测方法，包括：获取待检测的应用的资源文件字符串；基于所述资源文件字符串，获取所述应用的多个第一特征词；获取所述多个第一特征词中各第一特征词的恶意分值；基于各所述第一特征词的恶意分值，检测所述应用是否为恶意应用。2.根据权利要求1所述的方法，其中，获取所述多个第一特征词中各第一特征词的恶意分值之前，所述方法还包括：基于预设的黑名单、预设的恶意应用检测规则和所述多个第一特征词，检测并确定所述应用为非恶意应用。3.根据权利要求2所述的方法，其中，基于预设的黑名单、预设的恶意应用检测规则和所述多个第一特征词，检测并确定所述应用为非恶意应用，包括：获取所述多个第一特征词中各所述第一特征词在所述应用中出现的次数；基于预设的黑名单，检测所述多个第一特征词中出现在所述黑名单中的目标特征词；检测并确定所有的所述目标特征词的出现次数总和达到预设次数阈值，确定所述应用为恶意应用。4.根据权利要求1
‑
3任一所述的方法，其中，获取所述多个第一特征词中各第一特征词的恶意分值，包括：基于预先建立的特征词的恶意分值表，获取各所述第一特征词的恶意分值。5.根据权利要求4所述的方法，其中，基于预先建立的特征词的恶意分值表，获取各所述第一特征词的恶意分值之前，所述方法还包括：采集包括多个已知应用的应用样本集合；各所述已知应用包括多个第二特征词，各所述已知应用具有已知标签，所述已知标签用于标识对应的所述应用是否为恶意应用；对于各所述已知应用中的各所述第二特征词，计算各所述已知应用中的各所述第二特征词的特征值；基于各所述已知应用中的各所述第二特征词的特征值，获取所述第二特征词为恶意的概率值；基于各所述已知应用中的各所述第二特征词的特征值，获取所述第二特征词为非恶意的概率值；对于各所述已知应用中的各第二特征词，基于所述第二特征词为恶意的概率值和所述第二特征词为非恶意的概率值，获取所述第二特征词的恶意分值；基于各所述已知应用中的各所述第二特征词的恶意分值，建立所述特征词的恶意分值表。6.根据权利要求5所述的方法，其中，基于各所述已知应用中的各所述第二特征词的特征值，获取所述第二特征词为恶意的概率值，包括：基于各所述已知应用中的各所述第二特征词的特征值，计算所述第二特征词的在所述应用样本集合中的恶意应用样本中对应的特征值之和，作为第一数值；基于各所述已知应用中的各所述第二特征词的特征值，计算所述应用样本集合的恶意应用样本中，所有第二特征词的特征值之和，作为第二数值；基于所述第一数值和所述第二数值，计算所述第二特征词为恶意的概率值。
7.根据权利要求5所述的方法，其中，基于各所述已知应用中的各所述第二特征词的特征值，获取所述第二特征词为非恶意的概率值，包括：基于各所述已知应用中的各所述第二特征词的特征值，计算所述第二特征词的在所述应用样本集合中的非恶意应用样本中对应的特征值之和，作为第三数值；基于各所述已知应用中的各所述第二特征词的特征值计算所述应用样本集合的非恶意应用样本中，所有第二特征词的特征值之和，作为第四数值；基于所述第三数值和所述第四数值，计算所述第二特征词为非恶意的概率值。8.根据权利要求5
‑
7任一所述的方法，其中，基于预先建立的特征词的恶意分值表，获取各所述第一特征词的恶意分值，还包括：对于各所述第一特征词，检测所述特征词的恶意分值表中是否包括所述第一特征词；若包括，从所述特征词的恶意分值表中获取对应的所述第一特征词的恶意分值；若未包括，配置所述第一特征词的恶意分值。9.根据权利要求8所述的方法，其中，配置所述第一特征词的恶意分值，包括：配置所述第一特征词的恶意分值为0；或者获取所述特征词的恶意分值表中与所述第一特征词的语义相似度大于预设相似度阈值的至少一个候选特征词；从所述特征词的恶意分值表获取各所述候选特征词的恶意分值，得到至少一个恶意分值；基于所述至少一个恶意分值，确定所述第一特征词的恶意分值。10.根据权利要求1
‑
3任一所述的方法，其中，获取所述多个第一特征词中各第一特征词的恶意分值，包括：基于预先训练的恶意分值预测模型，获取各所述第一特征词的恶意分值。11.根据权利要求10所述的方法，其中，基于预先训练的恶意分值预测模型，获取各所述第一特征词的恶意分值，包括：对于各所述第一特征词，获取所述第一特征词在所述应用中的出现次数、在预先建立的应用样本集合中的出现次数、出现在所述应用样本集合中的恶意应用样本中出现的次数，包括有所述第一特征词的恶意应用样本的数量、出现在所述应用样本集合中的非恶意应用样本中出现的次数，包括有所述第一特征词的非恶意应用样本的数量中至少一个；基于所述第一特征词在所述应用中的出现次数、在所述应用样本集合中的出现次数、出现在所述应用样本集合中的恶意应用样本中出现的次数，包括有所述第一特征词的恶意应用样本的数量、出现在所述应用样本集合中的非恶意应用样本中出现的次数，包括有所述第一特征词的非恶意应用样本的数量中至少一个，采用预先训练的所述恶意分值预测模型，预测所述第一特征词的恶意分值。12.一种恶意应用的检测装置，包括：字符串获取模块，用于获取待检测的应用的资源文件字符串；特征词获取模块，用于基于所述资源文件字符串，获取所述应用的多个第一特征词；分值获取模块，用...

【专利技术属性】
技术研发人员：张展翔，吴承辉，管巍，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人