文件错误的定位方法及装置制造方法及图纸

技术编号：33281996 阅读：37 留言：0更新日期：2022-04-30 23:42

本发明专利技术涉及一种文件错误的定位方法、装置、终端设备和存储介质，通过获取待定位的多个测试报告文件；根据预先建立的错误检索模型，确定与测试报告文件对应的多个第一源文件；对第一源文件按照函数级别进行拆分，得到拆分后的第二源文件；根据预先建立的定位模型，确定测试报告文件和第二源文件之间函数级语义交互特征；采用预先建立的融合模块，对语义交互特征进行聚合，通过对多个第二源文件进行排序，确定与测试报告文件对应的目标源文件，可以快速查找到错误报告对应的目标源文件，提高了检测效率，节省时间。节省时间。节省时间。

全部详细技术资料下载

【技术实现步骤摘要】
文件错误的定位方法及装置

[0001]本专利技术涉及计算机
，尤其涉及一种文件错误的定位方法、装置、终端设备和存储介质。

技术介绍

[0002]bug是指一个错误，缺陷或者故障，其产生了错误的结果或者期望之外的结果。尽管使用了不同的软件质量控制过程，如软件测试和软件检查，但软件规模的增加和有限的开发资源使得开发人员在发布软件的同时仍然包含缺陷。
[0003]为了解决这个问题，很多大型软件项目建立了bug跟踪系统，有效地跟踪产品中的bug，然后要求世界各地的用户报告他们遇到的bug。在软件产品的开发和发布后生命周期中，错误报告的数量可能会越来越多，很容易变得难以处理。例如，A平台产品有3389个bug报告，而该项目平均每天收到300个新的bug报告。及时的bug修复对于软件系统的可用性和安全性至关重要，而定位和修复bug要开发人员花费大量的时间和精力。这些数字表明，仅仅依靠手工工作已无法满足日益增长的需求，而且手工进行测试效率较低。

技术实现思路

[0004]本专利技术意在提供一种文件错误的定位方...

【技术保护点】

【技术特征摘要】
1.一种文件错误的定位方法，其特征在于，所述方法包括：获取待定位的多个测试报告文件；根据预先建立的错误检索模型，确定与所述测试报告文件对应的多个第一源文件；对所述第一源文件按照函数级别进行拆分，得到拆分后的第二源文件；根据预先建立的定位模型，确定所述测试报告文件和所述第二源文件之间函数级语义交互特征；采用预先建立的融合模块，对所述语义交互特征进行聚合，通过对多个所述第二源文件进行排序，确定与所述测试报告文件对应的目标源文件。2.根据权利要求1所述的方法，其特征在于，所述预先建立的错误检索模型通过如下方式得到：获取预设数量的不相关源文件的第一样本数据；根据所述第一样本数据，对预设模型进行训练，得到训练结果；在所述训练结果满足如下函数的情况下，确定第一损失函数；其中：fixes(r)是预设错误报告的相关修复源文件集合，Φ
i
(r,s)是错误报告和源文件的第i个特征；当所述损失函数小于预设值时，将所述预设模型确定为所述错误检索模型。3.根据权利要求2所述的方法，其特征在于，所述预设模型至少包括AdaBoost树分类器、极端随机树分类器和梯度提升回归模型中的一种。4.根据权利要求2所述的方法，其特征在于，所述第一损失函数通过普通最小二乘法并结合正则化项来确定的，其中，所述正则化项至少包括无正则化或弹性网络。5.根据权利要求1所述的方法，其特征在于，所述预先建立的定位模型通过如下方式得到：获取第二样本数据，其中，所述第二样本数据至少包括CodeSearchNet数据集和项目数据集；根据所述第二样本数据对CodeBERT语言模型进行训练；计算第二损失函数，所述损失函数为交叉熵损失函数；其中，所述第二损失函数为：其中：p＝[p1,p2,..,p
C
]，每一个元素p
i
表示该样本属于第i类的概率；y＝[y1,y2,..,y
C
]是样本标签的one
...

【专利技术属性】
技术研发人员：梁洪亮，杭登极，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人