基于富样本径向投影可信聚类的软件性能可视评价方法技术

技术编号：39139832 阅读：14 留言：0更新日期：2023-10-23 14:54

本发明专利技术公开了一种基于富样本径向投影可信聚类的软件性能可视评价方法。将富样本条件下的数据集进行标准化处理，通过有界概率变量建立各性能指标的数学描述并计算其可信度，从而获得软件性能二级指标可信得分。将各软件性能二级指标可信得分整合为一系列二级性能指标可信得分向量构成的多维度数据点，通过受力平衡原理确定各多维数据点的径向投影坐标，生成Radviz图，对其进行聚类分析，获得软件性能评价结果。该方法充分利用已有富样本测试数据，并考虑了通过自动化测试获得的性能测试数据的波动，结合可视化技术进行软件性能评价，结果直观可信。结果直观可信。结果直观可信。

全部详细技术资料下载

【技术实现步骤摘要】
基于富样本径向投影可信聚类的软件性能可视评价方法

[0001]本专利技术涉及软件性能评价领域，尤其涉及一种基于富样本径向投影可信聚类的软件性能可视评价方法。

技术介绍

[0002]软件性能优劣往往是用户在多款功能相似的软件中选择适用工具时需考虑的重要因素。软件性能指标数据往往需通过测试获得，受测试环境不确定性的影响，即使采用相同的测试工具和测试用例对同一款软件进行多次重复测试所得的同一性能指标值也往往存在一定的波动。软件性能响应数据包括执行各类性能测试用例时所需的响应时间、内存占用量等不同类型，各类数据具有不同的量纲和不同的数量级，其值难以直接反映软件性能的优劣。此外，现有基于纯数学运算处理的软件性能评价方法不够直观。

技术实现思路

[0003]现有基于测试数据的软件性能评价方法没有考虑大量重复测试所得不确定性测试数据数学描述方式对评价结果可信度的影响，且不够直观。本专利技术的目的在于提供一种基于富样本径向投影可信聚类的软件性能可视评价方法，该方法针对样本量充足的软件性能指标测试数据建立各性能指标的有界概率描述并计算其可信度，从而利用富样本数据获得性能指标的可信得分，进而通过径向投影生成Radviz图并进行聚类分析，直观获得软件性能的评价结果。
[0004]本专利技术的目的是通过以下技术方案来实现的：一种基于富样本径向投影可信聚类的软件性能可视评价方法，包括如下步骤：
[0005]S1：确定软件性能评价指标集，包括性能一级指标Pr
i
,1≤i≤I
Pr
>及其下属的性能二级指标Pr
ij
,1≤j≤J
i
，其中，I
Pr
为性能一级指标个数，J
i
为性能一级指标Pr
i
下的性能二级指标个数；
[0006]S2：执行N次测试，获取各性能二级指标的原始测试数据，并进行标准化处理得到标准化数据；
[0007]S3：将软件性能评价指标的标准化数据n＝1,2,
…
,N整合为对应的样本集样本集中的最小值和最大值分别为和计算获得样本集的均值为方差为将均值和方差在区间内进行线
性变换得到进而获得广义贝塔分布的形状参数与为设一个概率不确定性变量其广义贝塔分布的有界概率密度函数为：
[0008][0009]其中Γ(
·
)是伽马函数；获取此概率密度变量的期望表示性能二级指标得分，标准差表示性能二级指标得分的不确定性，性能二级指标的不确定度为可信度为
[0010]S4：将各性能二级指标得分与可信度相乘，获得富样本条件下基于有界概率变量描述的软件性能二级指标可信得分
[0011]S5：假设有M款软件进行比较，每款软件的性能二级指标可信得分为Ex
m,k
,1≤m≤M,1≤k≤K，其中K为所有一级指标对应的二级指标的个数之和，即将Ex
m,k
,1≤m≤M,1≤k≤K整合为一个包含各款软件所有性能二级指标可信得分的二维数据矩阵E
M
×
K
，E
M
×
K
中的每一行E
m
＝(Ex
m,1
,...,Ex
m,K
),1≤m≤M为第m个软件性能二级指标可信得分向量构成的K维数据点，包含该款软件所对应的所有性能二级指标可信得分；对于K维数据点E
m
＝(Ex
m,1
,...,Ex
m,K
)，其第k,1≤k≤K维度的值Ex
m,k
即为第k个弹簧的弹性系数，每个弹簧一端的端点按顺序从与x轴正方向的夹角为0度时开始逆时针均匀分布于单位圆圆周上，将每个端点在圆周上的位置点与圆心连线，每个指标的角度θ
k
定义为该连线与x轴正方向的夹角，各端点R
k
的坐标为(cosθ
k
,sinθ
k
)，另一端固定在同一个平衡位置点P
m
上，根据受力平衡原理，标量化计算点P
m
的坐标(x
m
,y
m
)，即径向投影点坐标为
[0012][0013]S6：对二维数据矩阵E
M
×
K
中的所有数据点进行径向投影计算对应坐标，得到Radviz图；
[0014]S7：对通过径向投影获得的Radviz图进行聚类分析，直观获得软件性能可视评价结果。
[0015]进一步地，步骤S2中，对性能二级指标Pr
ij
的总共N个原始测试数据中的第n个数据样本若Pr
ij
为效益型指标，即越大反映对应的软件性能越好，则标准化数据若Pr
ij
为成本型指标，即越大反映对应的软件性能越差，则标准化数据其中和分别为所有参与测试的软件的同一性能二级指标Pr
ij
对应的响应数据最大值和最小值。
[0016]本专利技术的有益效果在于：
[0017](1)利用有界概率变量来描述富样本条件下软件性能指标的不确定性，进而计算各性能指标的可信度，从而在性能指标量化过程中充分考虑了软件性能富样本测试数据中所蕴含的概率不确定性的影响，获得了基于有界概率变量的软件性能指标可信得分。
[0018](2)利用软件性能指标的可信得分，通过基于受力平衡的径向投影生成了Radviz图，能够直观地反映不同软件性能指标的相似度，进而直观地分析比较不同软件性能的优劣。
附图说明
[0019]下面结合附图和实施例对本专利技术进一步说明：
[0020]图1是本专利技术方法的流程图；
[0021]图2是本专利技术实施例提供的三款三维CAD软件富样本测试数据径向可信投影生成的Radviz图。
具体实施方式
[0022]下面根据附图和优选实施例详细描述本专利技术，本专利技术的目的和效果将变得更加明白，应当理解，此处所描述的具体实施例仅仅用以解释本专利技术，并不用于限定本专利技术。
[0023]如图1所示，本专利技术提出的基于富样本径向投影可信聚类的软件性能可视评价方法，具体包括如下步骤：
[0024]S1：确定软件性能评价指标集，包括性能一级指标Pr
i
(1≤i≤I
Pr
)及其下属的性能二级指标Pr
ij
(1≤j≤J
i
)，其中，I
Pr
为性能一级指标个数，J
i
(1≤i≤I
Pr
)为性能一级指标Pr
i
下的性能二级指标个数；
[0025]S2：执行N次测试，获取各性能二级指标的原始测试数据，并进行标准化处理得到标准化数据；
[0026]S3：将软件性能评价指标的标准化数据(n＝1,2,
…
,N)整合为对应的样本集样本集中的最小值和最大值分别为和计算获得样本集的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于富样本径向投影可信聚类的软件性能可视评价方法，其特征在于，包括如下步骤：S1：确定软件性能评价指标集，包括性能一级指标Pr
i
,1≤i≤I
Pr
及其下属的性能二级指标Pr
ij
,1≤j≤J
i
，其中，I
Pr
为性能一级指标个数，J
i
为性能一级指标Pr
i
下的性能二级指标个数；S2：执行N次测试，获取各性能二级指标的原始测试数据，并进行标准化处理得到标准化数据；S3：将软件性能评价指标的标准化数据整合为对应的样本集样本集中的最小值和最大值分别为和计算获得样本集的均值为方差为将均值和方差在区间内进行线性变换得到进而获得广义贝塔分布的形状参数与为设一个概率不确定性变量其广义贝塔分布的有界概率密度函数为：其中Γ(
·
)是伽马函数；获取此概率密度变量的期望表示性能二级指标得分，标准差表示性能二级指标得分的不确定性，性能二级指标的不确定度为可信度为S4：将各性能二级指标得分与可信度相乘，获得富样本条件下基于有界概率变量描述的软件性能二级指标可信得分
S5：假设有M款软件进行比较，每款软件的性能二级指标可信得分为Ex
m,k
,1≤m≤M,1≤k≤K，其中K为所有一级指标对应的二级指标的个数之和，即将Ex
m,k
,1≤m≤M,1≤k≤K整合为一个包含各款软件所有性能二级指标可信得分的二维数据矩阵E
M
×
K
，E
M
×
K
中的每一行E
m
＝(Ex
m,1
,...,Ex
m,K

【专利技术属性】
技术研发人员：程锦，叶虎强，谭建荣，刘振宇，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人