一种基于决策树的软件需求预测方法、装置及可读存储介质制造方法及图纸

技术编号:38202343 阅读:15 留言:0更新日期:2023-07-21 16:46
本申请提供了一种基于决策树的软件需求预测方法、装置及可读存储介质,其特征在于,包括:S1、获取历史软件需求说明书,基于软件需求说明书提取软件需求特征关键词;S2、基于软件需求特征关键词建立第一需求特征词表和第一需求特征词频次表;S3、在根据历史软件需求说明书形成决策树模型;S4、输入待预测的软件需求说明书,基于上述决策树预测软件需求的测试范围。本发明专利技术提供了基于历史软件需求说明书预测待检测软件需求其测试范围的技术,根据历史项目的软件需求说明书、测试系统范围,通过关键词列表和关键词频次表相结合,构建决策树预测模型,有效的实现了基于决策树模型进行软件需求文档的测试系统范围预测。需求文档的测试系统范围预测。需求文档的测试系统范围预测。

【技术实现步骤摘要】
一种基于决策树的软件需求预测方法、装置及可读存储介质


[0001]本专利技术涉及软件需求分析相关的
,尤其涉及一种基于决策树的软件需求预测方法、装置及可读存储介质。

技术介绍

[0002]目前在测试过程中,在测试需求分析阶段,首要事情是需要根据软件需求说明书分析测试系统范围。随着企业的系统越来越多、业务关联关系越来越复杂,从软件需求说明书中,确定测试系统、关联系统范围的成本也越来越大,这为我们带来大量的人工分析和定位成本。因此如何实现自动化需求分析,降低人工分析成本,显得愈来愈重要。目前降低需求分析成本的广泛方案是假定已知测试系统范围,给出进一步的需求点分析结果,但是已有方案没有给出如何确定测试系统范围的方案。所以确定测试系统范围的过程,仍然需要大量的人工分析成本。
[0003]所以本申请针对以上技术问题,本专利技术提供了基于历史软件需求说明书预测待检测软件需求其测试范围的技术,根据历史项目的软件需求说明书、测试系统范围,通过关键词列表和关键词频次表相结合,构建决策树预测模型,有效的实现了基于决策树模型进行软件需求文档的测试系统范本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于决策树的软件需求预测方法,其特征在于,包括:S1、获取历史软件需求说明书,基于软件需求说明书提取软件需求特征关键词;S2、基于软件需求特征关键词建立第一需求特征词表和第一需求特征词频次表;S3、在根据历史软件需求说明书形成决策树模型的过程中,迭代计算各特征词下每个频次的信息增益,并根据最大信息增益对应的特征词划分当前特征词包含的数据集,以基于当前特征词分裂形成多个子特征词分支并进一步根据信息增益最大的字特征词划分数据集,直至子特征词满足第一预设条件后,建立决策树结束,所述第一预设条件包括最终划分各个子数据集的子特征词频次的信息增益相同;S4、输入待预测的软件需求说明书,基于上述决策树预测软件需求的测试范围。2.根据权利要求1所述的方法,其特征在于,所述S1包括:S11、按照第一预设规则将历史软件需求说明书进行初分类,其中,所述第一预设规则包括软件需求的历史测试相同范围大于预设阈值;S12、基于分类后的软件需求说明书,按照第一特征词重要程度规则计算特征词的重要程度,第一特征词重要程度规则包括基于TF

IDF计算特征词的关键程度,其中TF指的是词频,IDF指的是逆向文件频率;S13、选取重要程度从大到小的第一数量的特征词作为特征关键词。3.根据权利要求1所述的方法,其特征在于,所述S2还包括将第一需求特征词表和第一需求特征词频次表合并形成第一特征集。4.根据权利要求3所述的方法,其特征在于,所述S3包括:S31、首先计算每个特征词下的频次的信息增益,并选择信息增益或信息增益率最大的特征词的频次将历史软件需求说明书划分第一样本集与第二样本集;S32、删除第一特征集中的上述信息增益或信息增益率最大的特征词,在第一样本集与第二样本集里迭代计算信息增益或信息增益率最大的特征词的频次并将其命名为第二层分支特征词,基于第二层分支特征词划分第一样本集与第二样本集;以此类推划分历史软件需求说明书...

【专利技术属性】
技术研发人员:刘军辉赵晓丹章岩闫鑫冷炜
申请(专利权)人:中信银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1