一种基于概率模型的程序错误检测方法及系统技术方案

技术编号:15128649 阅读:68 留言:0更新日期:2017-04-10 08:22
本发明专利技术公开了一种基于概率模型的程序错误检测方法及系统,该方法包括以下步骤:S1、获取概率模型和待检测程序,从待检测程序中提取待检测的函数调用序列集合;S2、获取单个待检测的函数调用序列,求解最相似的函数调用序列集合,并计算联合概率;S3、根据相似集合对该待检测序列进行检测并生成修复方案;S4、完成该待检测序列的检测和修复后,记录检测到的各个错误信息及修复方案;S5、对待检测集合中的所有待检测序列检测完毕后,输出程序错误报告。本发明专利技术无需处理概率模型转换到确定性模型时的阈值选择问题,能够快速的检测程序中的错误,且检测准确率高。

【技术实现步骤摘要】

本专利技术涉及程序验证领域,尤其涉及一种基于概率模型的程序错误检测方法及系统
技术介绍
API使用协议是说明库函数之间调用顺序的一种程序约束,其经常在库函数发布文档中被遗漏,进而使得软件开发人员因错误的API使用方式造成各种软件错误,例如:调用java.util.Stack类的peek()函数之前,必须先调用push()函数,否则程序会因为空栈而抛出EmptyStackException异常;又比如调用java.util.Iteration类的next()函数之前,应该先调用hasNext(),否则会导致NoSuchElementException异常。据统计,Eclipse错误仓库中至少包含115个与函数调用缺失相关的软件错误。不仅如此,根据API使用协议还能够检测出对象未正确初始化以及资源泄露等类型的错误。当前,自动获得API使用协议的主要方法是从大量的API函数调用序列中,采用序列数据挖掘方法归纳出函数调用的序列模式。其中,采用概率模型进行API使用协议挖掘的方法具有广泛应用的前景。其原理是:采用程序静态分析或动态分析技术从客户端程序中提取大量的函数调用序列,然后从函数调用序列中归纳出采用概率自动机或马尔科夫模型等概率模型表示的API使用协议。与有限自动机等确定性模型相比,概率模型具有固有的抗噪能力,有望获得更高准确度的API使用协议。API使用协议的一个主要应用领域是程序错误检测。当前,基于概率模型API使用协议进行程序验证的主要方法是将概率模型转换为有限自动机等确定性模型,然后采用相应的方法进行错误检测。该方法存在的主要问题是选择理想的概率阈值将概率模型转换为确定性模型是一项困难的工作。不合适的概率阈值会损失API使用协议的精度,从而降低程序错误检测的准确性。
技术实现思路
本专利技术要解决的技术问题在于针对现有技术中程序错误检测中概率阈值难以确定的缺陷,提供一种无需确定概率阈值,且检测准确率高的基于概率模型的程序错误检测方法及系统。本专利技术解决其技术问题所采用的技术方案是:本专利技术提供一种基于概率模型的程序错误检测方法,包括以下步骤:S1、获取概率模型和待检测程序,从待检测程序中提取待检测的函数调用序列集合,记作待检测集合;S2、从待检测集合中获取单个待检测的函数调用序列,记作待检测序列,求解概率模型中与该待检测序列最相似的函数调用序列集合,记作相似集合;并计算相似集合中各函数调用序列在概率模型中的联合概率;S3、根据相似集合对该待检测序列进行检测并生成修复方案,相似集合中每一条函数调用序列对应一个错误报告,所有错误报告构成一个错误报告组,组内错误报告按照函数调用序列的联合概率降序排列;S4、完成该待检测序列的检测和修复后,记录检测到的各个错误信息及修复方案,包括:错误的函数调用名称、错误产生的位置;S5、对待检测集合中的所有待检测序列检测完毕后,输出程序错误报告。进一步地,本专利技术的步骤S1中的概率模型为API使用协议库,该概率模型由人为给出,或采用自动化方法从程序中获得。进一步地,本专利技术的步骤S2中的根据概率模型A验证单个待检测的函数调用序列q的正确性,其具体方法为:根据概率模型A和待检测序列q求解函数调用序列集合P,使得任意的函数调用序列p∈P,满足下列条件:a、设A*为去掉概率模型A中的概率后获得的确定性模型;b、函数调用序列p能够由A*产生;c、设p'为由A*产生的任一函数调用序列,则有δ(p,q)≤δ(p′,q),其中δ(p,q)表示函数调用序列p和q之间的距离。进一步地,本专利技术的步骤S2中计算联合概率的方法具体为:对于任意的函数调用序列p∈函数调用序列集合P,根据概率模型计算p的联合概率,联合概率为函数调用序列在概率模型中所对应路径上的概率的乘积;根据该联合概率对P中所有的函数调用序列按照从大到小进行排序。进一步地,本专利技术的步骤S3中对待检测序列进行检测和修复的具体方法为:按照联合概率从大到小依次获取函数调用序列集合P中函数调用序列p,比较函数调用序列p和待检测序列q,若二者相同,则q为正确的函数调用序列;否则,其中包含有错误;以最少的编辑操作将q转换为p,实施操作的位置和方法即为错误产生点和修复方案。本专利技术提供一种基于概率模型的程序错误检测系统,包括:程序分析器单元,用于获取概率模型和待检测程序,从待检测程序中提取待检测的函数调用序列集合,记作待检测集合;API使用协议库单元,用于为系统提供概率模型描述的API使用协议,用户可以向协议库中添加自定义的协议,概率模型的状态或迁移表示函数调用;最相似函数调用序列集合求解器单元,用于从待检测集合中获取单个待检测的函数调用序列,记作待检测序列,求解概率模型中与该待检测序列最相似的函数调用序列集合,记作相似集合;并计算相似集合中各函数调用序列在概率模型中的联合概率;序列错误检测器单元,用于根据相似集合对该待检测序列进行检测并生成修复方案,相似集合中每一条函数调用序列对应一个错误报告,所有错误报告构成一个错误报告组,组内错误报告按照函数调用序列的联合概率降序排列;程序错误报告器单元,用于对程序错误及修复方法进行格式化输出。进一步地,本专利技术的所述程序分析器单元包括程序静态分析器、程序动态分析器和二者结合的混合程序分析器。进一步地,本专利技术的所述最相似函数调用序列集合求解器单元求解的方法具体为:根据概率模型A和待检测序列q求解函数调用序列集合P,使得任意的函数调用序列p∈P,满足下列条件:a、设A*为去掉概率模型A中的概率后获得的确定性模型;b、函数调用序列p能够由A*产生;c、设p'为由A*产生的任一函数调用序列,则有δ(p,q)≤δ(p′,q),其中δ(p,q)表示函数调用序列p和q之间的距离。本专利技术产生的有益效果是:本专利技术的基于概率模型的程序错误检测方法,直接以概率模型描述的API使用协议作为输入,无需处理概率模型转换到确定性模型时的阈值选择问题;对于每一条待检测的函数调用序列输出一组错误报告,错误报告按照概率模型的联合概率进行降序排列,进一步提高了软件开发人员定位及解决程序错误的效率;本方法能够快速的检测程序中的错误,且检测准确率高。附图说明下面将结合附图及实施例对本专利技术作进一步说明,附图中:图1是本专利技术实施例的基于概率模型的程序错误检测方法的流程图;图2是本专利技术实施例的基于概率模型的程序本文档来自技高网
...
一种基于概率模型的程序错误检测方法及系统

【技术保护点】
一种基于概率模型的程序错误检测方法,其特征在于,包括以下步骤:S1、获取概率模型和待检测程序,从待检测程序中提取待检测的函数调用序列集合,记作待检测集合;S2、从待检测集合中获取单个待检测的函数调用序列,记作待检测序列,求解概率模型中与该待检测序列最相似的函数调用序列集合,记作相似集合;并计算相似集合中各函数调用序列在概率模型中的联合概率;S3、根据相似集合对该待检测序列进行检测并生成修复方案,相似集合中每一条函数调用序列对应一个错误报告,所有错误报告构成一个错误报告组,组内错误报告按照函数调用序列的联合概率降序排列;S4、完成该待检测序列的检测和修复后,记录检测到的各个错误信息及修复方案,包括:错误的函数调用名称、错误产生的位置;S5、对待检测集合中的所有待检测序列检测完毕后,输出程序错误报告。

【技术特征摘要】
1.一种基于概率模型的程序错误检测方法,其特征在于,包括以下步骤:
S1、获取概率模型和待检测程序,从待检测程序中提取待检测的函数调用
序列集合,记作待检测集合;
S2、从待检测集合中获取单个待检测的函数调用序列,记作待检测序列,
求解概率模型中与该待检测序列最相似的函数调用序列集合,记作相似集合;
并计算相似集合中各函数调用序列在概率模型中的联合概率;
S3、根据相似集合对该待检测序列进行检测并生成修复方案,相似集合中
每一条函数调用序列对应一个错误报告,所有错误报告构成一个错误报告组,
组内错误报告按照函数调用序列的联合概率降序排列;
S4、完成该待检测序列的检测和修复后,记录检测到的各个错误信息及修
复方案,包括:错误的函数调用名称、错误产生的位置;
S5、对待检测集合中的所有待检测序列检测完毕后,输出程序错误报告。
2.根据权利要求1所述的基于概率模型的程序错误检测方法,其特征在
于,步骤S1中的概率模型为API使用协议库,该概率模型由人为给出,或采
用自动化方法从程序中获得。
3.根据权利要求1所述的基于概率模型的程序错误检测方法,其特征在
于,步骤S2中的根据概率模型A验证单个待检测的函数调用序列q的正确性,
其具体方法为:
根据概率模型A和待检测序列q求解函数调用序列集合P,使得任意的函
数调用序列p∈P,满足下列条件:
a、设A*为去掉概率模型A中的概率后获得的确定性模型;
b、函数调用序列p能够由A*产生;
c、设p'为由A*产生的任一函数调用序列,则有δ(p,q)≤δ(p′,q),其中
δ(p,q)表示函数调用序列p和q之间的距离。
4.根据权利要求1所述的基于概率模型的程序错误检测方法,其特征在
于,步骤S2中计算联合概率的方法具体为:
对于任意的函数调用序列p∈函数调用序列集合P,根据概率模型计算p
的联合概率,联合概率为函数调用序列在概率模型中所对应路径上的概率的乘
积;根据该联合概率对P中所有的函数调用序列按照从大到小进行排序。
5.根据权利要求1所述的基于概率模型的程序错误检测方...

【专利技术属性】
技术研发人员:陈灯魏巍张彦铎李晓林李迅于宝成鲁统伟闵峰周华兵朱锐卢涛彭丽
申请(专利权)人:武汉工程大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1