软件行为取样方法、相关设备及软件系统技术方案

技术编号:21971805 阅读:42 留言:0更新日期:2019-08-28 01:33
本发明专利技术提供了一种软件行为取样方法,包括如下步骤:接收待取样的软件,对该软件的底层系统调用行为进行撷取,处理生成系统调用序列并输出;对所述系统调用序列中的每一底层系统调用行为设定一个对应的数值,以形成一数值对应库;根据所述数值对应库将所述系统调用序列转换为数值序列;按照预设的取样规则及预设的短序列长度参数对所述数值序列进行取样,生成固定长度的短序列,将全部的所述短序列处理生成等维短序列集并置入深度学习训练数据库进行储存。本发明专利技术还提供软件行为取样软件系统、软件行为取样设备、计算机程序产品及计算机可读存储介质。与相关技术相比,实施本发明专利技术的技术方案在自动侦测恶意软件的准确率高且分类应用种类多。

Software Behavior Sampling Method, Related Equipment and Software System

【技术实现步骤摘要】
软件行为取样方法、相关设备及软件系统
本专利技术涉及计算机安全领域,尤其涉及一种软件行为取样方法、软件行为取样软件系统、软件行为取样设备、计算机程序产品及计算机可读存储介质。
技术介绍
目前,随着大数据及人工智能时代来临,大数据及人工智能均以类神经网络(Neuralnetwork)为基础,结合高算力的图形处理器(GraphicProcessingUnit,简称GPU)进行各种文字、图片及视频的分类应用。其中,类神经网络为基础且较流行的人工智能算法为深度学习(DeepLearning)算法,此类算法在图形辨识领域已取得了相当巨大的成功。然而,目前的深度学习算法对于恶意软件自动侦测领域应用存在格式上的困难,主要因为图形辨识与恶意软件自动侦测的训练数据格式有着相当大的差异,从而造成深度学习算法在恶意软件自动侦测领域应用较少。具体的,通常恶意软件自动侦测会以操作系统底层的系统调用序列作为训练数据,但其格式为不等维的时间序列,且为文字格式,但类神经网络的输入格式必须为等维数值序列,例如图形辨识的深度学习应用要求每一张训练图片皆须为相同大小,且数值介于0-255间。从而造成深度学习算法难本文档来自技高网...

【技术保护点】
1.一种软件行为取样方法,其特征在于,该方法包括如下步骤:接收待取样的软件,对该软件的底层系统调用行为进行撷取,处理生成系统调用序列并输出;对所述系统调用序列中的每一底层系统调用行为设定一个对应的数值,以形成一数值对应库;根据所述数值对应库将所述系统调用序列转换为数值序列;按照预设的取样规则及预设的短序列长度参数对所述数值序列进行取样,生成固定长度的短序列,将全部的所述短序列处理生成等维短序列集并置入深度学习训练数据库进行储存。

【技术特征摘要】
1.一种软件行为取样方法,其特征在于,该方法包括如下步骤:接收待取样的软件,对该软件的底层系统调用行为进行撷取,处理生成系统调用序列并输出;对所述系统调用序列中的每一底层系统调用行为设定一个对应的数值,以形成一数值对应库;根据所述数值对应库将所述系统调用序列转换为数值序列;按照预设的取样规则及预设的短序列长度参数对所述数值序列进行取样,生成固定长度的短序列,将全部的所述短序列处理生成等维短序列集并置入深度学习训练数据库进行储存。2.根据权利要求1所述的软件行为取样方法,其特征在于,所述软件行为取样方法还包括步骤:所述深度学习训练数据库将所述等维短序列集发送至类神经网络以实施深度学习算法训练。3.根据权利要求2所述的软件行为取样方法,其特征在于,所述深度学习训练数据库将所述等维短序列集发送至类神经网络的前提条件为:储存于所述深度学习训练数据库的所述等维短序列集数量大于预设的所述深度学习算法训练要求数量。4.根据权利要求1所述的软件行为取样方法,其特征在于,所述系统调用序列包括文字、图片以及视频中任意一种。5.根据权利要求1所述的软件行为取样方法,其特征在于,所述取样规则为滑动方法。6.一种软件行为取样软件系统,其特征在于,所述取样软件系统包括:撷取程序模块,用于接收待取样的软件,对该软件的底层系统调用行为进行撷取,处理生成系统调用序列并输出;数值对应库,用于对所述系统调用序...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:网御安全技术深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1