当前位置: 首页 > 专利查询>高培淞专利>正文

一种基于数据挖掘的软件产品线范围界定方法技术

技术编号:15214925 阅读:119 留言:0更新日期:2017-04-25 04:57
本发明专利技术涉及一种基于数据挖掘的软件产品线范围界定方法,属于计算机领域。分析相似系统,大量整理已有项目数据,收集包括项目领域,开发周期,开发人力资源数,总资金,启动资金,模块数,异常数等数据,整理录入数据库,发掘启动资金,周期等目标数据与其他影响因素的相关性,发掘相关系数,争取建立目标数据与其他数据的相关方程。比如:开发周期T=(项目模块数n*a1+(页面数b1+beans数b2))/(人力资源p*a3)/(开发人员熟练度a4+项目经理经验a5)其中参数由数据挖掘得到的相关性系数提供。本发明专利技术的优点在于:建立了项目组数据数据库,并不断将新项目数据填入其中。核心资产中加入产品线范围参数。项目范围、资金、领域可以被量化计算。

A software product line scope definition method based on Data Mining

The invention relates to a method for defining the range of software product lines based on data mining. Similar analysis system, a plenty of existing data collection project, including project field, development cycle, development of human resources, total capital, start-up capital, module number, the number of abnormal data, sorting into databases, explore start-up capital, cycle target data and other factors influencing the correlation, explore the correlation coefficient, the correlation equation for the establishment of the target data and other data. For example: the development cycle of T= (project number n*a1+ (page number b1+beans number B2)) / (human resources p*a3) / (developer proficiency a4+ project manager experience A5) of which parameters are obtained by data mining correlation coefficient. The invention has the advantages that the data base of the project group is established, and the new project data is continuously filled in. Product line range parameters in core assets. Project scope, funding, and areas can be quantified.

【技术实现步骤摘要】

本专利技术属于计算机领域。
技术介绍
随着60年代的“软件危机”的出现使程序设计人员明白难于维护的软件成本是极其高昂的,当软件的规模不断扩大时,这种软件的综合成本可以说是没有人能负担的,并且即使投入了高昂的资金也难以得到可靠的产品,而软件重用的思想是解决这一问题的根本方法。作为最高级别的软件复用,软件产品线成为业界关注的焦点。软件产品线的发展史大体可以分为以下三个阶段:1.20世纪70年代,产品线开始出现,并进入发展时期。相比于其他类似系统,“程序家族”率先由DavidParnas提出,这被认为是产品线的最初起源。2.20世纪80年代一家瑞士的潜艇公司将软件产品线应用于大规模软件生产,在潜艇操作系统,飞机航运系统等之上工作的多条产品线为该公司节省了百分之七十以上的成本,大大提高了生产效率。3.20世纪90年代,又由于欧美国家和地区连续召开多次与产品线有关的技术会议,对产品线技术进行讨论和研究,使得产品线技术向着成熟的方向发展起来。软件家族系列年会(PFE)于1996年在欧洲开始,美国也于2000年开始美国的软件产品线年会,两者于2004年合并为软件产品线(SPLC),软件产品线继续在国际中良性发展。当代对软件产品线研究最多的国外机构是卡耐基·梅隆大学的软件工程研究所(CMU/SEI),SEI对于软件产品线做出以下定义:产品线是一个产品集合,这些产品共享一个公共的、可管理的特征集,这个特征集能满足选定的市场或任务领域的特定需求。这些系统遵循一个预描述的方式,在公共的核心资源基础上开发的。国内对软件产品线的研究主要集中在北京航空大学,南京大学等几所大学的软件学院,以及一些大型软件公司,比如东软集团拥有自己独立开发的软件产品线UniEAP业务基础平台产品,就是一款面向软件产品线开发模式的业务基础平台,它充分体现了面向软件产品线的开发模式,由开发框架、公共构件和方法学组成的,通过多层次、结构化的基础架构、组件及相关开发工具,用于支撑应用软件快速构造、支撑业务开发的全面解决方案。该解决方案的目标是使应用软件的设计与开发人员能够通过构件复用和构件装配等手段,快速完成应用软件的构造。当用户的需求发生变化时,可以将对开发的影响降至最低,最终达到业务专家通过简单的配置就可满足用户需求的目的。该研究所同时提出包括核心资产开发,产品开发,管理的软件产品线循环模型,并对诸多实践域进行了详细的定义。而在平台开发的最先阶段,软件产品线的范围界定至关重要。目前国内软件公司管理方式落后,罕有CMMI3级以上公司,项目组内部秩序混乱,项目的计划、软件涉及领域、资金、需要人力资本等都是由项目经理的经验决定,缺乏可验证性,也无法保证准确。
技术实现思路
本专利技术提供一种基于数据挖掘的软件产品线范围界定方法,以解决现有国内软件公司管理方式落后,罕有CMMI3级以上公司,项目组内部秩序混乱,项目的计划、软件涉及领域、资金、需要人力资本等都是由项目经理的经验决定,缺乏可验证性,也无法保证准确的的问题。本专利技术的技术方案是:产品线范围:产品线范围是关于构成产品线的产品或产品线所能包括的产品的描述。最简单的情况,范围也应包括一个列举了产品名称的可计数列表。更通俗的说法是,该描述应列举出所有产品的共性和它们之间的差异,包括产品所能提供的特征或操作、产品所表现出的性能或其他品质属性、产品所能运行的平台等等。产品线范围的定义一般称为确定范围。一个产品线要取得成功,其范围必须仔细定义。如果范围太大,产品成员变化太广,核心资产将不能适应其变化,生产效益会降低,产品线也会陷入传统的一次性产品开发模式。如果范围太小,核心资产的通用性可能不足以适应将来的变化,产品线将是停滞不前的,范围经济效益永远不能实现,投入的回报也永远不能物质化。产品线的范围必须将正确的产品定位目标,一般通过以下几方面的知识来决定,即相似产品或系统、当前或预测的市场因素、竞争结果的本质、组织采用产品线方法的业务目标(例如合并一系列相似但目前仍独立的产品开发项目)。随着市场条件的变化、组织计划的变化、新机遇的出现,或者随着组织逐渐适应软件产品线工作方式,产品线的范围也在随之演进,范围的演进是产品线演进的起点,在使之保持其先进性。3.数据挖掘数据挖掘:Datamining,又译为资料探勘、数据采矿。它是数据库知识发现:Knowledge-DiscoveryinDatabases,简称:KDD,中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。需要是专利技术之母。近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括商务管理,生产控制,市场分析,工程设计和科学探索等。数据挖掘利用了来自如下一些领域的思想:(1)来自统计学的抽样、估计和假设检验,(2)人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论。数据挖掘也迅速地接纳了来自其他领域的思想,这些领域包括最优化、进化计算、信息论、信号处理、可视化和信息检索。一些其他领域也起到重要的支撑作用。特别地,需要数据库系统提供有效的存储、索引和查询处理支持。源于高性能(并行)计算的技术在处理海量数据集方面常常是重要的。分布式技术也能帮助处理海量数据,并且当数据不能集中到一起处理时更是至关重要。分析相似系统,大量整理已有项目数据,收集包括项目领域,开发周期,里程碑数目,开发人力资源数,总资金,启动资金,模块数,异常数等数据,整理录入数据库,发掘启动资金,周期等目标数据与其他影响因素的相关性,发掘相关系数,争取建立目标数据与其他数据的相关方程。比如:开发周期T=(项目模块数n*a1+(页面数b1+beans数b2))/(人力资源p*a3)/(开发人员熟练度a4+项目经理经验a5)其中参数由数据挖掘得到的相关性系数提供。本专利技术的优点在于:建立了项目组数据数据库,并不断将新项目数据填入其中。核心资产中加入产品线范围参数。项目范围、资金、领域可以被量化计算。具体实施方式产品线范围:产品线范围是关于构成产品线的产品或产品线所能包括的产品的描述。最简单的情况,范围也应包括一个列举了产品名称的可计数列表。更通俗的说法是,该描述应列举出所有产品的共性和它们之间的差异,包括产品所能提供的特征或操作、产品所表现出的性能或其他品质属性、产品所能运行的平台等等。产品线范围的定义一般称为确定范围。一个产品线要取得成功,其范围必须仔细定义。如果范围太大,产品成员变化太广,核心资产将不能适应其变化,生产效益会降低,产品线也会陷入传统的一次性产品开发模式。如果范围太小,核心资产的通用性可能不足以适应将来的变化,产品线将是停滞不前的,范围经济效益永远不能实现,投入的回报也永远不能物质化。产品线的范围必须将正确的产品定位目标,一般通过以下几方面的知识来决定,即相似产品或系统、当前或预测的市场因素、竞争结果的本质、组织采用产品线方法的业务目标(例如合并一系列相似但目前仍独立的产品开发项目)。随着市场条件本文档来自技高网
...

【技术保护点】
一种基于数据挖掘的软件产品线范围界定方法,分析相似系统,大量整理已有项目数据,收集包括项目领域,开发周期,里程碑数目,开发人力资源数,总资金,启动资金,模块数,异常数等数据,整理录入数据库,发掘启动资金,周期等目标数据与其他影响因素的相关性,发掘相关系数,争取建立目标数据与其他数据的相关方程。

【技术特征摘要】
1.一种基于数据挖掘的软件产品线范围界定方法,分析相似系统,大量整理已有项目数据,收集包括项目领域,开发周期,里程碑数目,开发人力资源数,总资金,启...

【专利技术属性】
技术研发人员:高培淞
申请(专利权)人:高培淞
类型:发明
国别省市:吉林;22

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1