一种基于代码变更集的离散重构编码故障定位方法技术

技术编号:43844132 阅读:27 留言:0更新日期:2024-12-31 18:38
本发明专利技术公开了一种基于代码变更集的离散重构编码故障定位方法,属于人工智能及信息检索领域,所述故障定位方法使用故障定位模型进行定位,所述故障定位模型包括代码语义学习模块、故障报告学习模块和故障报告‑代码匹配模块;相比传统的故障定位方法,本方法在对代码的编码阶段根据不同代码句的功能对其进行强监督引导,同时尽可能量化并减小了编码阶段的语义损失,离散的编码形式也加强了模型泛化能力。

【技术实现步骤摘要】

本专利技术属于人工智能及信息检索领域,具体是一种基于代码变更集的离散重构编码故障定位方法


技术介绍

1、故障定位通常被定义为信息检索(information retrieval, ir)任务,在该任务中,通常存在大量引起故障的代码变更集和未与之配对的故障报告,且每份故障报告通常描述的是一个由多个代码变更集引起的故障。

2、故障定位任务的目标是根据二者的语义相关性,为输入的故障报告定位到引起该故障的所有代码变更集。该任务的重点是如何训练模型学习故障报告和与之配对的代码变更集之间语义相关性,要实现该目标,就必须使模型分别学习到故障报告和代码变更集的语义,再将二者映射到同一个向量空间进行比较。由于故障报告使用自然语言描述,其语义容易通过基于bert的自然语言处理模型的编码器,使用故障报告经过微调训练得到,所以模型学习的难点通常放在如何完整的学习代码语义并将其与学习到的故障报告语义匹配。

3、代码语言不同于普通的自然语言,虽然形式多样,但许多不同代码句往往却对应同一种逻辑或控制功能,而现有的方法,在对代码的编码阶段,没有据此设计监督信号引本文档来自技高网...

【技术保护点】

1.一种基于代码变更集的离散重构编码故障定位方法,其特征在于,所述故障定位方法使用故障定位模型进行定位,所述故障定位模型包括代码语义学习模块、故障报告学习模块和故障报告-代码匹配模块;

2.根据权利要求1所述的一种基于代码变更集的离散重构编码故障定位方法,其特征在于,S2的具体步骤为:

3.根据权利要求2所述的一种基于代码变更集的离散重构编码故障定位方法,其特征在于,S3的具体步骤为:

4.根据权利要求3所述的一种基于代码变更集的离散重构编码故障定位方法,其特征在于,S4的具体步骤为:

5.根据权利要求4所述的一种基于代码变更集的离散重构编...

【技术特征摘要】

1.一种基于代码变更集的离散重构编码故障定位方法,其特征在于,所述故障定位方法使用故障定位模型进行定位,所述故障定位模型包括代码语义学习模块、故障报告学习模块和故障报告-代码匹配模块;

2.根据权利要求1所述的一种基于代码变更集的离散重构编码故障定位方法,其特征在于,s2的具体步骤为:

3.根据权利要求2所述的一种基于代码变更集的离散重构编码故障定位方法,其特征在于,s3的具体步骤为:

4.根据...

【专利技术属性】
技术研发人员:施恩译徐晋渝黄海平常舒予周子浩江秉川肖甫王睿
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1