基于状态层的软件行为建模方法技术

技术编号：8105650 阅读：265 留言：0更新日期：2012-12-21 04:17

本发明专利技术是一种基于状态层的软件行为建模方法。首先，截获软件正常执行时的系统调用序列,利用隐马尔科夫模型（以下简称隐马模型）将系统调用序列转化为状态序列；然后，根据状态序列建立状态转移图；最后，根据软件自身功能，抽取出敏感功能的状态序列，建立局部敏感功能图。该模型从系统调用的基础上抽取出更高层的行为模式，并根据软件的实际执行过程和功能建图，因此对软件行为的描述更加准确完备，存储更加简单，并对图赋予了实际的语义。该模型对软件行为的描述更加准确，隐马判断状态的正确率高达95%以上。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术旨在建立软件行为模型，保证行为安全，属于信息安全领域。
技术介绍
软件行为是指软件运行时的表现形态和状态演变过程。软件行为模型就是指根据软件的行为信息建立的行为状态序列以及状态的变迁，可以表征软件的正常行为特征，并用于异常检测。目前，软件行为的建模方法有静态和动态两种。针对软件行为的静态分析多集中在代码层，直接对源代码进行分析，可以把握程序的循环跳转分支，但静态分析并不能反映软件的真实运行状态，并受到源码不可得和软件抗逆向分析技术等限制。动态分析多集中于系统层的系统调用，是主机入侵检测的研究热点。大部分动态建模从系统调用入手是因为1)系统调用是操作系统提供给应用程序访问系统资源的接口，所以调用状况在一定程度上能够反映程序的行为特征；2)系统调用序列及其片段数量有限，分析起来比较简便；3)各操作系统的系统调用函数版本间变化非常小，比较稳定。所以目前看来，其为描述软件行为最合适的对象。因此现有研究对软件行为的定义大都围绕系统调用展开，并引申出行为轨迹和功能轨迹的定义来描述软件行为。软件的行为轨迹即系统调用序列。功能轨迹的定义各不相同，但基本上集中于检查点场景和时间戳，有些还会附加内存占用率和CPU使用率。建模的方式大多借鉴入侵检测的建模方法，基于统计学、机器学习、数据挖掘、文本分类、有限状态自动机等方法。动静结合的混合模型越来越多，分析的因素也越来越全面。现有的建模方法虽然看似全面，但都没有从软件的实际功能出发，不能准确的描述软件行为；过于全面的分析会导致模型复杂，实用性不强，例如动静结合的Dyck模型和HFA模型，包含了控制流分析，数据流分析，...

【技术保护点】
基于状态层的软件行为建模方法，其特征在于；包括以下步骤：首先进行序列模式的提取：截获软件正常执行时的系统调用序列，挖掘出所有序列模式；然后进行状态层的推导：先利用隐马模型的学习问题为每个序列模式建立一个隐马模型，再利用隐马的评估问题判定状态；最后根据状态序列建立状态转移图：在建图之前，先给出相关概念和定义；定义1STG是一个三元组，STG＝{V，E，W}；V是图中的节点，即已知状态集，E是连接图中节点的有向边的集合，W是权值，表示某条边出现次数与所有边出现总次数的比值，定义2状态距离D：为两个不同状态之间的距离，用以判断两个状态的相似程度；两状态分别对应的系统调用序列，设短的序列为lmin，序列长度为l1，长的序列为lmax，序列长度为l2，先将lmin的第一位与lmax的第一位对齐，处在相同位置的数值如果相同记为0，不同记为1，将记录的值相加之后除以短的序列长度l1，记为R；然后lmin向后滑动一位，也就是将lmin的第一位与lmax的第二位对齐，再进行一次上述操作，记录R2，直到lmin的末尾与lmax的末尾对齐为止，然后计算定义3入度in+STG中终止于某顶点的边的权值之和称为该...

【技术特征摘要】

【专利技术属性】
技术研发人员：赖英旭，张文雯，杨震，刘静，李健，
申请(专利权)人：北京工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人