【技术实现步骤摘要】
基于测地线流核的神经网络软件缺陷预测方法
本专利技术涉及一种软件缺陷预测算法,具体而言,涉及一种基于测地线的神经网络软件缺陷预测方法,属于流形学习和神经网络算法
技术介绍
近年来,随着软件规模的逐渐扩大、软件复杂度日益增加,随之而来的是软件维护成本逐步上升。在软件的开发过程中对软件缺陷进行预测,能够合理的分配测试资源,提高软件开发的效率。近年来,软件缺陷预测在软件工程领域引起了研究者的广泛关注,基于机器学习的软件缺陷预测方法也成为研究的热点。然而在实际的应用过程中,这类方法通常都会面临一个问题:当需要对新的项目进行缺陷预测时,所拥有的训练样本过少,从而导致难以训练正确的模型。另一方面,一类项目通常含有大量的相似项目,由这些相似项目训练的软件缺陷预测模型并不能直接用来预测。假设我们已经训练了大量的C++编写的项目的缺陷分类器,而目前又有一个新的Java项目,通常的做法是在当前项目下利用有限的样本标记重新训练分类器,但是这种方式忽略了项目之间的相关性,尽管项目的语言不同,其内部的程序设计架构和算法机理一样,因此项目之间有很强的相关性,如果利用这种相关性进行迁 ...
【技术保护点】
1.一种基于测地线流核的神经网络软件缺陷预测方法,其特征在于,包括如下步骤:S1、将数据集降维到对应的子空间中,并确定最优的子空间维度;S2、利用数据集降维得到的特征表示构建测地线流;S3、计算测地线流核,根据测地线流核计算得到源数据和目标数据的变换矩阵及特征空间;S4、根据得到的特征空间对神经网络分类器进行训练,最终得到预测结果。
【技术特征摘要】
1.一种基于测地线流核的神经网络软件缺陷预测方法,其特征在于,包括如下步骤:S1、将数据集降维到对应的子空间中,并确定最优的子空间维度;S2、利用数据集降维得到的特征表示构建测地线流;S3、计算测地线流核,根据测地线流核计算得到源数据和目标数据的变换矩阵及特征空间;S4、根据得到的特征空间对神经网络分类器进行训练,最终得到预测结果。2.根据权利要求1所述的基于测地线流核的神经网络软件缺陷预测方法,其特征在于:S1中所述数据集包括源数据集和目标数据集。3.根据权利要求2所述的基于测地线流核的神经网络软件缺陷预测方法,其特征在于,S1具体包括如下步骤:S11、对源数据集和目标数据集进行PCA降维处理,分别得到新的特征表示PCAS和PCAT,计算将所述源数据集和目标数据集合并在一起时的子空间PCAS+T,子空间的不一致度D(d)被定义为,D(d)=0.5[sinαd+sinβd],其中,αd表示在PCAS和PCAS+T之间第d个主成分角,βd表示在PCAT和PCAS+T之间第d个主成分角,sinαd和sinβd为最小相关距离;S12、采用贪心算法,确定最优的子空间维度,计算公式为,d*=min{d|D(d)=1},其中,d*的数值大小与子空间维度的最优程度呈正相关。4.根据权利要求2所述的基于测地线流核的神经网络软件缺陷预测方法,其特征在于,S2具体包括如下步骤:S21、依据S1中得到的结果,将测地线流参数化,令PS、PT分别代表源数据和目标数据的两个子空间的基序列,P...
【专利技术属性】
技术研发人员:荆晓远,孙静,孙莹,吴飞,董西伟,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。