当前位置: 首页 > 专利查询>同济大学专利>正文

基于非正交坐标系下软件成本评估方法技术

技术编号:8883341 阅读:217 留言:0更新日期:2013-07-04 02:08
本发明专利技术涉及一种基于非正交坐标系下软件成本评估方法,其特征在于:该方法包括以下步骤:计算任意两个已知属性间的互信息值;将该互信息值转换成非正交坐标系下两个坐标轴的夹角,建立非正交坐标系;该非正交坐标系下的每个坐标轴分别对应每个已知属性;计算已知属性与预测成本属性间的互信息,同样把该互信息值转换成对应已知属性的权重;把用来估算软件成本的历史案例和当前案例映射在该非正交坐标系下,根据欧式距离和Cosine定理找到与当前案例最为相似的历史案例,之后输出历史案例进行成本估算。本发明专利技术一方面去除已知属性间的冗余度,另一方面增强已知属性与被预测属性间的相关性。

【技术实现步骤摘要】

本专利技术涉及一种基于互信息函数定义非正交坐标系下坐标轴间的夹角,并在该非正交坐标系下度量当前案例与历史案例间的相似度,由此对当前案例进行成本估算。
技术介绍
随着软件系统复杂度的增长,其规模也呈现相应的趋势,在19世纪60年代末期软件危机(如预算超支,软件进度滞后等现象)的出现,预示着软件成本估算将在软件开发过程中扮演者举足轻重的作用。同时,随着研究重点的转向,基于类比方法的研究成为日前炙手可热的技术。类比方法是基于CBR (case-based reasoning)技术在软件成本估算中的一种应用,即通过当前案例的属性在历史案例中寻找最为相似的案例,并对当前案例的成本进行评估。这里需要说明的是当前案例是指待评估的软件成本,而历史案例是指已经完成的项目。这个过程好比人类的学习过程,当我们学习新的知识时,总会不由自主地联系已学的知识,试图寻找到新知识的突破口,这个过程就是寻找相似度的过程。由上述过程可以看出,基于类比方法进行软件成本估算需解决三个主要问题:1)不同的已知属性对被预测属性的作用力不同,因此如何区分属性的作用力将在选择相似的历史案例过程中起到很大的作用;2)如何度量相似度,即如何建立相似度的数学模型;3)考虑到已知属性间的关系并不是完全独立的,因此属性间的冗余度将会直接影响到对软件成本估算的准确率。由上述背景分析可以看出相似度的度量则是基于CBR算法进行类比的重中之重,而如何去除掉属性间的冗余度以及如何区分不同属性对预测属性的作用力则是评价方法好坏的标准。传统的相似度度量方法是基于正交直接坐标系下,根据当前案例和历史案例间的距离。这里有两种形式:一种是不加权重的欧式距离,另一种则是赋予权重的欧式距离,但是这个权重的数值则是由专家指定,很难说清该权重值的意义,因此要找到具有说服力和符合数学性质的权重实属不易。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种,用于解决现有技术中难以去除掉属性间的冗余度以难以区分不同属性对预测属性的作用力的问题。为实现上述目的及其他相关目的,本专利技术提供一种,该方法包括以下步骤:I)计算任意两个已知属性间的互信息值;2)将该互信息值转换成非正交坐标系下两个坐标轴的夹角,建立非正交坐标系;该非正交坐标系下的每个坐标轴分别对应每个已知属性;3)计算已知属性与预测成本属性间的互信息,同样把该互信息值转换成对应已知属性的权重;4)把用来估算软件成本的历史案例和当前案例映射在该非正交坐标系下,根据欧式距离和Cosine定理找到与当前案例最为相似的历史案例,之后输出历史案例进行成本估算。优选地,该方法进一步包括通过MMRE和Pred方法对估算结果进行评价的步骤。优选地,所述步骤2)中,在该非正交坐标系中每一维度分别代表每一个已知属性。优选地,所述步骤4)中应用CBR算法,利用非正交坐标系下的距离与Cosine定理相结合寻找出与当前案例最相似的历史案例进行估算。本专利技术在计算案例间的相似度问题上,消除已知属性间的冗余度,并为每个已知属性赋予一个能够具有说服力和满足数学性质的权重来区分每个已知属性对被预测属性预测的能力。本专利技术首先基于互信息函数表示已知属性间的冗余度,同时考虑到已知属性间的关系并不是完全独立的,因此利用互信息的函数表示属性间的夹角;其次权重的赋值也考虑到相应属性的物理含义(即,对被预测属性的作用力越强,则权重应越大);最后利用非正交坐标系下的距离公式和Cosine定理,查找案例在高维空间中的投影,投影角度越小,距离越小越相似。附图说明图1为本专利技术的基于非正交坐标系下估算软件成本方法使用的数据样本中Function Point (FP,已知属性)与Summary Work Effort (SWE,预测成本属性)间的关系。其中,图中矩形表示当前要预测的案例,三角形表示按cosine定理找到的历史相似案例,圆圈表示按照欧式距离找到的历史相似案例。图2为本专利技术的基于非正交坐标系下估算软件成本方法使用的数据样本中Time与SWE间的关系。图3为本专利技术的基于非正交坐标系下估算软件成本方法使用的数据样本中Time,FP, Organization Type和SWE任意两两间的关系。图4为本专利技术的流程示意图。具体实施例方式以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。请参阅图1所示。需要说明的是,本实施例中所提供的图示仅以示意方式说明本专利技术的基本构想,遂图式中仅显示与本专利技术中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。本专利技术提供一种,该方法包括以下步骤:I)计算任意两个已知属性间的互信息值;2)将该互信息值转换成非正交坐标系下两个坐标轴的夹角,建立非正交坐标系;该非正交坐标系下的每个坐标轴分别对应每个已知属性;3)计算已知属性与预测成本属性间的互信息,同样把该互信息值转换成对应已知属性的权重;4)把用来估算软件成本的历史案例和当前案例映射在该非正交坐标系下,根据欧式距离和Cosine定理找到与当前案例最为相似的历史案例,之后输出历史案例进行成本估算。本专利技术首先通过计算出任意两个已知属性间的互信息,本实施例中,X,Y分别代表本专利技术中的属性列,如X代表“时间”属性,Y代表“函数点”属性互信息的计算公式:1 (X,Y) =H(X)-H(XI Y),这里I (X,Y)是X和Y的互信息,H(X)为X的熵,H(XlY)是条件熵。H⑴的计算公式:H⑴=_ Σ x e xP (x) 1gp (χ),这里ρ (χ)是离散随机变量X的概率密度函数。Η(Χ| Y)的计算公式:11(父|¥)=-2!^){2^4(叉,7)1(^ (叉|7),这里ρ (χ I y)是一对离散随机变量(X,Y)的条件分布。H(X, Y)的计算公式:H(X, Y) =- Σ x e χ Σ y e γρ (χ, y) 1gp (x | y) ,H(X, Y)是 X 和 Y 的联合熵,这里P (χ |y)是一对离散随机变量(X,Y)的联合分布。例如:设(X,Y)服从如下联合分布:权利要求1.一种,其特征在于:该方法包括以下步骤: 1)计算任意两个已知属性间的互信息值; 2)将该互信息值转换成非正交坐标系下两个坐标轴的夹角,建立非正交坐标系;该非正交坐标系下的每个坐标轴分别对应每个已知属性; 3)计算已知属性与预测成本属性间的互信息,同样把该互信息值转换成对应已知属性的权重;4)把用来估算软件成本的历史案例和当前案例映射在该非正交坐标系下,根据欧式距离和Cosine定理找到与当前案例最为相似的历史案例,之后输出历史案例进行成本估算。2.根据权利要求1所述的,其特征在于:该方法进一步包括通过MMRE和Pred方法对估算结果进行评价的步骤。3.根据权利要求1所述的,其特征在于:所述步骤2)中,在该非正交坐标系中每一维度分别代表每一个已知属性。4.根据权利要求1所述的,其特征在于:所述步骤4)中应用本文档来自技高网
...

【技术保护点】
一种基于非正交坐标系下软件成本评估方法,其特征在于:该方法包括以下步骤:1)计算任意两个已知属性间的互信息值;2)将该互信息值转换成非正交坐标系下两个坐标轴的夹角,建立非正交坐标系;该非正交坐标系下的每个坐标轴分别对应每个已知属性;3)计算已知属性与预测成本属性间的互信息,同样把该互信息值转换成对应已知属性的权重;4)把用来估算软件成本的历史案例和当前案例映射在该非正交坐标系下,根据欧式距离和Cosine定理找到与当前案例最为相似的历史案例,之后输出历史案例进行成本估算。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘琴朱宏明杨筱雯关瑞博褚晓圆
申请(专利权)人:同济大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1