【技术实现步骤摘要】
本专利技术属于人工智能及信息检索领域,具体是一种基于代码变更集的离散重构编码故障定位方法。
技术介绍
1、故障定位通常被定义为信息检索(information retrieval, ir)任务,在该任务中,通常存在大量引起故障的代码变更集和未与之配对的故障报告,且每份故障报告通常描述的是一个由多个代码变更集引起的故障。
2、故障定位任务的目标是根据二者的语义相关性,为输入的故障报告定位到引起该故障的所有代码变更集。该任务的重点是如何训练模型学习故障报告和与之配对的代码变更集之间语义相关性,要实现该目标,就必须使模型分别学习到故障报告和代码变更集的语义,再将二者映射到同一个向量空间进行比较。由于故障报告使用自然语言描述,其语义容易通过基于bert的自然语言处理模型的编码器,使用故障报告经过微调训练得到,所以模型学习的难点通常放在如何完整的学习代码语义并将其与学习到的故障报告语义匹配。
3、代码语言不同于普通的自然语言,虽然形式多样,但许多不同代码句往往却对应同一种逻辑或控制功能,而现有的方法,在对代码的编码阶段,没
...【技术保护点】
1.一种基于代码变更集的离散重构编码故障定位方法,其特征在于,所述故障定位方法使用故障定位模型进行定位,所述故障定位模型包括代码语义学习模块、故障报告学习模块和故障报告-代码匹配模块;
2.根据权利要求1所述的一种基于代码变更集的离散重构编码故障定位方法,其特征在于,S2的具体步骤为:
3.根据权利要求2所述的一种基于代码变更集的离散重构编码故障定位方法,其特征在于,S3的具体步骤为:
4.根据权利要求3所述的一种基于代码变更集的离散重构编码故障定位方法,其特征在于,S4的具体步骤为:
5.根据权利要求4所述的一种基于代
...【技术特征摘要】
1.一种基于代码变更集的离散重构编码故障定位方法,其特征在于,所述故障定位方法使用故障定位模型进行定位,所述故障定位模型包括代码语义学习模块、故障报告学习模块和故障报告-代码匹配模块;
2.根据权利要求1所述的一种基于代码变更集的离散重构编码故障定位方法,其特征在于,s2的具体步骤为:
3.根据权利要求2所述的一种基于代码变更集的离散重构编码故障定位方法,其特征在于,s3的具体步骤为:
4.根据...
【专利技术属性】
技术研发人员:施恩译,徐晋渝,黄海平,常舒予,周子浩,江秉川,肖甫,王睿,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。