当前位置: 首页 > 专利查询>重庆大学专利>正文

一种预训练代码增强的编程问答社区答案推荐方法技术

技术编号:40475499 阅读:26 留言:0更新日期:2024-02-26 19:11
本发明专利技术涉及一种预训练代码增强的编程问答社区答案推荐方法,分为两个阶段,训练阶段和推荐阶段。训练阶段可分为标签推荐预训练阶段和问答分类微调阶段,其中标签推荐预训练模型使用问题中的标题、主体、代码信息作为输入,以问题标签作为真值进行学习;在微调阶段,复用预训练模型,分别对问题和答案中的信息进行编码,最后将问题和答案的特征向量映射到分类空间中。推荐阶段对于一个新问题,先使用搜索引擎查询相似的问题标题,取前Q个作为候选问题,并确定候选答案,将候选答案与新问题作为微调过的模型的输入,得到每对问答的分类的置信概率,通过加权求和的方式计算问答的匹配得分,排序之后前Q’为最终的推荐答案。

【技术实现步骤摘要】

本专利技术涉及代码搜索,特别涉及一种预训练代码增强的编程问答社区答案推荐方法


技术介绍

1、近年来,编程问答社区迅速发展,开发者遇到问题时,能够在stack overflow、csdn等编程问答社区中快速检索答案。但是,由于编程问答社区中存在大量未解决的问题,导致用户的使用体验不佳。答案推荐方法可以帮助用户快速获取准确答案,已成为编程问答社区中的热门问题。

2、现有的编程问答社区答案推荐方法,通常聚焦于问题和答案的文本语义,忽视了编程问答社区本身的编程专业性,对于stack overflow而言:1)可链接问题:问答中的超链接可以将多个问题联系起来,其中隐含的链接关系往往是被忽视的;2)代码特征:问答中的代码块会被当作噪声删去,然而代码实际上是编程问答社区的核心特征之一。

3、国内外研究者围绕编程问答社区展开了大量研究,且主要从三个方面进行研究:基于问题检索的答案推荐、基于答案排序的答案推荐、基于专家推荐的答案推荐。

4、基于问题检索的答案推荐从模型、特征、度量等多方面研究了问题的表征,在问题检索任务中取得了一定的成效本文档来自技高网...

【技术保护点】

1.一种预训练代码增强的编程问答社区答案推荐方法,其特征在于:包括如下步骤:

2.如权利要求1所述的一种预训练代码增强的编程问答社区答案推荐方法,其特征在于:所述S1中计算每个问题标签对于该问题的置信概率distribution的步骤如下:

3.如权利要求2所述的一种预训练代码增强的编程问答社区答案推荐方法,其特征在于:所述S2调过程如下:所述S2中计算postive、neural+、neural-、negative四种类别的置信概率的具体步骤如下:

【技术特征摘要】

1.一种预训练代码增强的编程问答社区答案推荐方法,其特征在于:包括如下步骤:

2.如权利要求1所述的一种预训练代码增强的编程问答社区答案推荐方法,其特征在于:所述s1中计算每个问题标签对于该问题的置信概率distribution...

【专利技术属性】
技术研发人员:徐玲罗兆林穆文翰刘超鄢萌雷晏刘长鑫程皓罡秦瑞
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1