一种大数据挖掘算法及其在软件缺陷管理上的应用制造技术

技术编号:33133074 阅读:16 留言:0更新日期:2022-04-17 00:53
本发明专利技术涉及数据挖掘技术领域,且公开了一种大数据挖掘算法,包括:采集大数据信息,对其进行数据预处理,得到以p

【技术实现步骤摘要】
一种大数据挖掘算法及其在软件缺陷管理上的应用


[0001]本专利技术涉及数据挖掘
,具体为一种大数据挖掘算法及其在软件缺陷管理上的应用。

技术介绍

[0002]软件缺陷是静态的表现,如软件编程中语法的错误、代码的不规范等。通过软件测试较早的发现错误,防止错误被传播到软件过程的后续阶段变成软件缺陷。
[0003]而软件缺陷管理成为软件项目开发管理的一个非常重要的环节。为了更有效率的发现软件系统中所存在的缺陷并使之及时得到处理,在软件缺陷管理中引用了数据挖掘技术。软件系统中数据挖掘过程是对其软件系统数据库中的大量数据进行抽取和转换,并且分析数据后通过模型化处理,最后挖掘出关键性缺陷模块的过程。

技术实现思路

[0004](一)解决的技术问题
[0005]本专利技术旨在提供一种大数据挖掘算法,该大数据挖掘算法可以应用在软件缺陷管理上,能够为软件缺陷管理提供客观的依据。
[0006](二)技术方案
[0007]为实现上述目的,本专利技术提供如下技术方案:
[0008]一种大数据挖掘算法,包括以下步骤:
[0009]步骤一,采集大数据信息,对其进行数据预处理,得到以p
j
为特征指标、样本量为y
i
的输入层数据矩阵S
ij
=(y
i
,p
j
,m
ij
);
[0010]式中,y
i
表示数据样本,p
j
表示数据样本的特征指标,m
ij
表示第i个数据样本第j个特征指标的量值,i表示样本的序号,j表示特征指标的序号;
[0011]步骤二,首先根据隶属度函数μ
ij
,依次计算每一个样本y
i
的任一特征指标p
j
的隶属度,然后将矩阵S
ij
转换隶属度矩阵T
ij
,之后根据隶属度矩阵T
ij
,构造最优数据样本y0的矩阵K
0j

[0012]步骤三,计算数据样本y
i
的任一特征指标p
j
的标准化权重w
j

[0013]步骤四,首先确定数据样本y
i
的关联系数θ
ij
,然后计算输出层数据,即数据样本y
i
的总体关联特征P(y
i
);
[0014]步骤五,将总体关联特征P(y
i
)与给定标准值N进行比较,以此来判定样本数据的综合特征指标。
[0015]优选的,所述大数据挖掘算法可以应用在软件缺陷管理上。
[0016]优选的,所述应用在软件缺陷管理上的大数据挖掘算法,包括以下步骤:
[0017]步骤一,采集软件缺陷管理的大数据信息,对该大数据信息进行数据预处理,得到以需求质量、设计文档质量、编码成员技术、系统内部资源程序为特征指标的输入层数据矩阵RS
ij
=(ry
i
,rp
j
,rm
ij
);
[0018]步骤二,首先根据隶属度函数rμ
ij
,依次计算每一个软件缺陷管理数据样本ry
i
的任一特征指标rp
j
的隶属度,然后将矩阵RS
ij
转换隶属度矩阵RT
ij
,之后根据隶属度矩阵RT
ij
,构造最优样本ry0的矩阵RK
0j

[0019]步骤三,根据下述公式,计算软件缺陷管理数据样本ry
i
的任一特征指标rp
j
的标准化权重rw
j

[0020]步骤四,首先确定软件缺陷管理数据样本ry
i
的关联系数rθ
ij
,然后计算软件缺陷管理数据样本ry
i
的总体关联特征rP(ry
i
);
[0021]步骤五,当总体关联特征rP(ry
i
)大于等于给定标准值N=0.5时,判定软件缺陷管理数据样本ry
i
为存在缺陷,需要对软件项目的开发过程进行全面性的缺陷管理。
[0022](三)有益的技术效果
[0023]与现有技术相比,本专利技术具备以下有益的技术效果:
[0024]本专利技术通过对以p
j
为特征指标、样本量为y
i
的输入层数据进行挖掘计算,输出得到数据样本y
i
的总体关联特征P(y
i
),将总体关联特征P(y
i
)与给定标准值N进行比较,以此来判定数据样本y
i
的综合特征指标,将该挖掘方法应用到软件缺陷管理时,可以通过计算得到的软件缺陷管理数据样本ry
i
的总体关联特征rP(ry
i
)可以实现对于软件缺陷管理数据样本ry1是否存在缺陷,以及需要对软件项目的开发过程进行全面性的缺陷管理,提供客观的依据。
具体实施方式
[0025]一种大数据挖掘算法,包括以下步骤:
[0026]步骤一,采集大数据信息,对其进行数据预处理,得到以p
j
为特征指标、样本量为y
i
的输入层数据矩阵S
ij
=(y
i
,p
j
,m
ij
);
[0027][0028]式中,y
i
表示数据样本,p
j
表示数据样本的特征指标,m
ij
表示第i个数据样本第j个特征指标的量值,i表示样本的序号,j表示特征指标的序号;
[0029]步骤二,首先根据隶属度函数μ
ij
,依次计算每一个样本y
i
的任一特征指标p
j
的隶属度,然后将矩阵S
ij
转换隶属度矩阵T
ij
,之后根据隶属度矩阵T
ij
,构造最优数据样本y0的矩阵K
0j

[0030]μ
ij
=(m
ij

min(m
ij
))/(max(m
ij
)

min(m
ij
));
[0031][0032][0033]式中,μ
ij
为第i个数据样本第j个特征指标的隶属度;
[0034]步骤三,根据下述公式,计算数据样本y
i
的任一特征指标p
j
的标准化权重w
j

[0035]w
j
=(1

Q
j
)本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种大数据挖掘算法,其特征在于,包括以下步骤:步骤一,采集大数据信息,对其进行数据预处理,得到以p
j
为特征指标、样本量为y
i
的输入层数据矩阵S
ij
=(y
i
,p
j
,m
ij
);式中,y
i
表示数据样本,p
j
表示数据样本的特征指标,m
ij
表示第i个数据样本第j个特征指标的量值,i表示样本的序号,j表示特征指标的序号;步骤二,首先根据隶属度函数μ
ij
,依次计算每一个样本y
i
的任一特征指标p
j
的隶属度,然后将矩阵S
ij
转换隶属度矩阵T
ij
,之后根据隶属度矩阵T
ij
,构造最优数据样本y0的矩阵K
0j
;步骤三,计算数据样本y
i
的任一特征指标p
j
的标准化权重w
j
;步骤四,首先确定数据样本y
i
的关联系数θ
ij
,然后计算输出层数据,即数据样本y
i
的总体关联特征P(y
i
);步骤五,将总体关联特征P(y
i
)与给定标准值N进行比较,以此来判定样本数据的综合特征指标。2.根据权利要求1所述的一种大数据挖掘算法,其特征在于,...

【专利技术属性】
技术研发人员:李梦杨付主木陶发展冀保峰
申请(专利权)人:洛阳师范学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1