一种项目过程管理预测数据的排异方法技术

技术编号:21091325 阅读:42 留言:0更新日期:2019-05-11 10:36
一种项目过程管理预测数据的排异方法,包括以下步骤:S1、确定数据的分布特性,参照已有的样本数据对预测数据的均值、方差进行评估;S2、采用假设检验的方法计算预测数据精确的近似概率分布模型;S3、定义置信概率并确定置信门限阈值,根据置信门限阀值来判断预测数据是否异常,找出异常数据并剔除。通过预测数据的排异算法提高了检测数据的合理性和有效性,为项目管理阶段做了相应的数据支持,使项目管理者获得的阶段信息更加真实可靠,为项目成功奠定了基础。

An Exclusion Method for Predictive Data of Project Process Management

【技术实现步骤摘要】
一种项目过程管理预测数据的排异方法
本专利技术涉及一种项目过程管理预测数据的排异方法。
技术介绍
近些年可谓是新科技快速发展的阶段,诸如人工智能、机器学习、物联网以及自动化新型技术的演进。软件技术被认为是促进各项业务增长的催化剂,软件产品是否能按照预期的成本、进度、质量顺利的完成被越来越多的企业重点关注。软件产品能否顺利交付的基础就是项目管理,它涵盖项目工作范围、过程风险、项目资源、任务目标、经历的里程碑、过程工作量、进度等,管理目的是让整个项目从分析、设计、编码、测试、维护等全部生命周期都能在管理者的控制下,以预期投入的成本,按质的交付给用户使用。然而在软件项目管理过程中如计划的制定、项目进度控制、人员安排、资源人投入、问题分析等重要环节又不可或缺相应的数据分析,怎样从大量预测数据中筛选出有价值且正确数据显得尤为重要,这项工作的好坏直接决定了整个软件项目开发的成败,介于此我们引进了一种数据排异算法,将测量数据中异常或可能造成预测结果偏差的数据进行排除,最终使得预测更真实准确便于管理者决策,达到项目管理的目的。软件开发过程中如果对过程数据分析不彻底不准确造成了判断的失误,都是潜在的风险源,它可能引导项目一步一步走向失败,同样如果过程把控好数据分析精准,软件项目就会随着设计思路迈向成功。数据分析过程中,异常数据的出现会直接导致分析结果发生显著的变化造成得到的结果超出预期,从而使管理者对整个项目过程的推断、控制和预测不准确出现错误的判断,给整个项目的顺利完成带来了风险,因此有效的检测、排查、防治数据异常有着很重要的作用。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种通过预测数据的排异算法提高了检测数据的合理性和有效性,为项目管理阶段做了相应的数据支持,能够使项目管理者获得的阶段信息更加真实可靠的项目过程管理预测数据的排异方法。本专利技术的目的是通过以下技术方案来实现的:一种项目过程管理预测数据的排异方法,包括以下步骤:S1、确定数据的分布特性,参照已有的样本数据对预测数据的均值、方差进行评估;S2、采用假设检验的方法计算预测数据精确的近似概率分布模型;S3、定义置信概率并确定置信门限阈值,根据置信门限阀值来判断预测数据是否异常,找出异常数据并剔除。进一步地,所述步骤S1具体实现方法为:定义预测数据的属性变量为X,它服从某种数据分布形式f(x),表达式为:X~f(x)运用统计学知识,计算样本数据y=(a11,a21,a31,…am1)r的频率分布fP(x),并对其均值μ、方差进行σ估计,具体表达式如下:进一步地,所述步骤S2具体实现方法为:采用概率分布结构相似的方法,确定属性值的概率分布f(x);K个概率密度函数的分布律为gk(x)和gk(n);正态分布为:分布的相似度计算公式为:利用不等式,得出:0≤Sh≤1,k∈(1,2,3…,N);N为概率密度函数或分布律的个数;当fp(x)=h·gk(x)或fp(n)=h·gk(n)时,Sk=1;h为比例系数;若最大的相似度则近似认为:进一步地,所述步骤S3具体实现方法为:从极值处开始,对每个数据的属性值分布函数的最大值和最小值进行判断:其中,R为预设的门限阈值,当某数据的属性值分布函数的最大值和最小值同时满足上述两个不等式时则将该数据判断为异常数据,将该异常数据剔除,并继续判断剩余数据。本专利技术的有益效果是:本专利技术提供了一种项目过程管理预测数据的排异方法,通过预测数据的排异算法提高了检测数据的合理性和有效性,为项目管理阶段做了相应的数据支持,使项目管理者获得的阶段信息更加真实可靠,为项目成功奠定了基础。附图说明图1为本专利技术的项目过程管理预测数据的排异方法的流程图。具体实施方式异常数据的定义:异常就是预测数据集中偏离了大部分数据的那部分数据。异常数据与同一数据集中其他数据的行为和模型都不一致。异常数据排异方法针对单一属性的样本数据进行排异,单一数据的样本属性的结构形式为:假设大量数据集在一起形成了一个样本矩阵。样本中的单一行是一个数据对象,不同数据对象所表示的不同物质等,每一列数据样本对象代表了一个属性特征,属性值指描述数据特征的数据值。如对象个数为m属性个数为n,数据集样本的矩阵为m*n,其中i对象的第个j属性值为aij,样本矩阵y表达式为:n=1则此样本数据为单属性,n>1时是多属性。单属性样本数据n=1,则样本矩阵即为样本向量y,其数据结构为:y=(a11,a21,a31,…am1)r。下面结合附图进一步说明本专利技术的技术方案。如图1所示,一种项目过程管理预测数据的排异方法,包括以下步骤:S1、确定数据的分布特性,参照已有的样本数据对预测数据的均值、方差进行评估;具体实现方法为:假定预测数据符合某种分布如:正态分布;从测试数据中抽取符合正态分布的数据作为样本;定义预测数据的属性变量为X,它服从某种数据分布形式f(x),表达式为:X~f(x)运用统计学知识,计算样本数据y=(a11,a21,a31,…am1)r的频率分布fP(x),并对其均值μ、方差进行σ估计,具体表达式如下:S2、采用假设检验的方法计算预测数据精确的近似概率分布模型;具体实现方法为:采用概率分布结构相似的方法,确定属性值的概率分布f(x);K个概率密度函数的分布律为gk(x)和gk(n);正态分布为:分布的相似度计算公式为:利用不等式,得出:0≤Sh≤1,k∈(1,2,3…,N);N为概率密度函数或分布律的个数;当fp(x)=h·gk(x)或fp(n)=h·gk(n)时,Sk=1;h为比例系数;若最大的相似度则近似认为:S3、定义置信概率并确定置信门限阈值,根据置信门限阀值来判断预测数据是否异常,找出异常数据并剔除;具体实现方法为:从极值处开始,对每个数据的属性值分布函数的最大值和最小值进行判断:其中,R为预设的门限阈值,当某数据的属性值分布函数的最大值和最小值同时满足上述两个不等式时则将该数据判断为异常数据,将该异常数据剔除,并继续判断剩余数据。本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本专利技术的原理,应被理解为本专利技术的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本专利技术公开的这些技术启示做出各种不脱离本专利技术实质的其它各种具体变形和组合,这些变形和组合仍然在本专利技术的保护范围内。本文档来自技高网...

【技术保护点】
1.一种项目过程管理预测数据的排异方法,其特征在于,包括以下步骤:S1、确定数据的分布特性,参照已有的样本数据对预测数据的均值、方差进行评估;S2、采用假设检验的方法计算预测数据精确的近似概率分布模型;S3、定义置信概率并确定置信门限阈值,根据置信门限阀值来判断预测数据是否异常,找出异常数据并剔除。

【技术特征摘要】
1.一种项目过程管理预测数据的排异方法,其特征在于,包括以下步骤:S1、确定数据的分布特性,参照已有的样本数据对预测数据的均值、方差进行评估;S2、采用假设检验的方法计算预测数据精确的近似概率分布模型;S3、定义置信概率并确定置信门限阈值,根据置信门限阀值来判断预测数据是否异常,找出异常数据并剔除。2.根据权利要求1所述的一种项目过程管理预测数据的排异方法,其特征在于,所述步骤S1具体实现方法为:定义预测数据的属性变量为X,它服从某种数据分布形式f(x),表达式为:X~f(x)运用统计学知识,计算样本数据y=(a11,a21,a31,…am1)r的频率分布fP(x),并对其均值μ、方差进行σ估计,具体表达式如下:3.根据权利要求1所述的一种项目过程管理预测数据的排异方法,其特征在于,所述...

【专利技术属性】
技术研发人员:唐雪飞张青龙岳超胡茂秋
申请(专利权)人:成都康赛信息技术有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1