一种基于问题报告的软件语义摘要自动生成方法技术

技术编号:16152601 阅读:53 留言:0更新日期:2017-09-06 18:09
本发明专利技术公开了一种基于问题报告的软件语义摘要自动生成方法,先构建开源软件信息数据库;然后获取项目托管社区中的问题报告数据和代码变更记录数据,并将之存储在数据库的问题报告数据表和代码变更记录数据表中;再使用正则表达式从代码变更记录中抽取其出现的问题报告id;然后对问题报告与软件代码进行位置匹配,最后进行语义提取与聚类,将生成的语义摘要存储在数据库的软件语义摘要数据表中。本发明专利技术通过软件的问题报告和代码变更记录为软件的代码文件或代码段自动标注语义信息,可提高开发人员复用软件的效率。

【技术实现步骤摘要】
一种基于问题报告的软件语义摘要自动生成方法
本专利技术涉及软件开发领域,尤其涉及一种基于问题报告的软件语义摘要的自动生成方法。
技术介绍
软件复用技术是指在软件开发中,对现有资源的再利用从而避免重复劳动的解决方案。通过软件复用,可以极大的提高软件开发效率和质量。例如著名的手机照片分享应用Instagram,在其发展之初只有5名技术人员,后端工程师不到3人,却利用了十多款开源软件,在仅仅8周时间内,打造了最初的Instagram,并通过提供的稳定服务吸引了大批用户,软件复用的作用可见一斑。同时,开源软件的发展为软件复用提供了丰富的资源。与商业软件不同,开源软件的代码是公开的,其他的软件开发者可以选择对整个软件或是软件中部分代码进行复用。但是开发者在复用之前,首先要了解其要复用的整个软件、目标文档或者某一段代码是如何工作的、有什么样的功能。对于整个软件来说,开发者可以从软件简介和文档中了解;对于细粒度的代码段来说,开发者可以通过代码段中的注释了解代码的实现过程。但是对于粗粒度的代码文件或者是规模大的代码,则很难从上述两种方式中进行了解,因为软件文档多是从整体功能和使用方式方面进行阐释,而本文档来自技高网...
一种基于问题报告的软件语义摘要自动生成方法

【技术保护点】
一种基于问题报告的软件语义摘要自动生成方法,其特征在于,包括如下步骤:S1、构建开源软件信息数据库,所述开源软件信息数据库包含问题报告数据表、代码变更记录数据表和软件语义摘要数据表;S2、获取项目托管社区中的问题报告数据和代码变更记录数据,并将之存储在数据库的问题报告数据表和代码变更记录数据表中;S3、使用正则表达式从代码变更记录中抽取其出现的问题报告id;S4、问题报告与软件代码位置匹配:通过代码变更记录数据将问题报告中的描述信息和代码位置关联,具体包括:S401、问题报告与代码变更记录匹配:使用代码变更记录中出现的#id寻找相关id的问题报告;S402、语义信息合并:将问题报告中的标题和描...

【技术特征摘要】
1.一种基于问题报告的软件语义摘要自动生成方法,其特征在于,包括如下步骤:S1、构建开源软件信息数据库,所述开源软件信息数据库包含问题报告数据表、代码变更记录数据表和软件语义摘要数据表;S2、获取项目托管社区中的问题报告数据和代码变更记录数据,并将之存储在数据库的问题报告数据表和代码变更记录数据表中;S3、使用正则表达式从代码变更记录中抽取其出现的问题报告id;S4、问题报告与软件代码位置匹配:通过代码变更记录数据将问题报告中的描述信息和代码位置关联,具体包括:S401、问题报告与代码变更记录匹配:使用代码变更记录中出现的#id寻找相关id的问题报告;S402、语义信息合并:将问题报告中的标题和描述,以及代码变更记录的描述信息合并记作d,将其作为文件或代码片段f的原始语义信息,写入数据库的软件语义摘要数据表中;S5、语义提取与聚类:对于原始描述信息d,使用文档主题生成模型生成若干主题词或短语,生成的主题词或短语作为文件或代码片段f的语义摘要存储在数据库的软件语义摘要数据表中。2.如权利要求1所述的方法,其特征在于...

【专利技术属性】
技术研发人员:余跃王涛尹刚王怀民宋晨希张迅辉李志星
申请(专利权)人:中国人民解放军国防科学技术大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1