【技术实现步骤摘要】
恶意破解软件的预测方法、装置、电子设备和存储介质
[0001]本专利技术涉及计算机数据安全领域,尤其涉及一种恶意破解软件的预测方法、装置、电子设备和存储介质。
技术介绍
[0002]在当今时代,数据已经成为一种生产要素,各大机构或企业对数据文件和技术文件的保密工作非常重视。
[0003]传统的文件加密解密方案是通过输入密码的方式实现的,但对于每天都有大量文件要处理的企业来说,反复输入密码是非常不方便的,也不能防范内部员工将解密后的文件泄露出去。为解决这些问题,透明加解密技术诞生了。文件在磁盘上以密文方式存储,打开时首先被加密软件客户端注入的消息钩子截获,解密成明文后再提交给相应程序;保存时同样被消息钩子截获,加密后再保存到磁盘上。整个加密和解密的过程,对用户是透明的,用户使用文件过程中几乎感受不到加密解密程序的存在。而且能很好的保护加密文件,外泄的密文不能被外界轻易解密。
[0004]恶意破解软件同样利用透明加解密使用的消息钩子机制,在透明加解密系统环境下,待应用程序打开并解密文件后,设法获取到内存中的明文信 ...
【技术保护点】
【技术特征摘要】
1.一种恶意破解软件的预测方法,其特征在于,包括:响应于应用程序开始运行,提取所述应用程序的第一目录文件名信息,生成预测特征;将所述预测特征输入至机器学习模型,得到所述机器学习模型输出的第一预测值;其中,所述机器学习模型预先通过预设比例的正负样本训练,所述正负样本根据多个应用程序的第二目录文件名信息和文件透明加密破解的相关网页处理得到;根据所述第一预测值确定所述应用程序是否为恶意破解软件。2.根据权利要求1所述的方法,其特征在于,所述正负样本根据多个应用程序的第二目录文件名信息和文件透明加密破解的相关网页处理得到的步骤,包括:对所述文件透明加密破解的相关网页进行信息抽取,得到多段目标文本;将所述目标文本中的非结构化信息转化成结构化信息;通过命名实体识别确定所述结构化信息中与所述文件透明加密破解相关的实体名称,将所述实体名称作为所述正样本的文本语料。3.根据权利要求2所述的方法,其特征在于,所述正负样本根据多个应用程序的第二目录文件名信息和文件透明加密破解的相关网页处理得到的步骤,还包括:获取若干应用程序的第二目录文件名信息;其中,所述应用程序包括正常应用程序和恶意破解软件;基于用户行为日志数据从所述应用程序中确定所述正常应用程序,将所述正常应用程序的第二目录文件名信息作为所述负样本的负文本语料;将除了所述正常应用程序以外的其他应用程序的第二目录文件名信息作为所述正样本的正文本语料。4.根据权利要求3所述的方法,其特征在于,所述预设比例的正负样本通过如下方式生成:对所述正文本语料和所述负文本语料进行分词,得到所述正样本的第一分词特征和所述负样本的第一分词特征;基于分词相似度算法对所述负样本进行聚类,得到聚类后的所述负样本,保证所述正样本和所述负样本符合所述预设比例;对所述正样本的第一分词特征和聚类后的所述负样本的第一分词特征进行汇总统计,过滤所述正样本中的低频分词特征以及聚类后的所述负样本中的低频分词特征,得到所述正样本的第二分词特征和聚类后的所述负样本的第二分词特征;分别对所述正样本的第二分词特征和聚类后的所述负样本第二分词特征进行编码;基于正样本标签、编码后...
【专利技术属性】
技术研发人员:李亮,梁金千,崔培升,
申请(专利权)人:北京亿赛通科技发展有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。