System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于自然语言代码搜索的系统和方法技术方案_技高网
当前位置: 首页 > 专利查询>硕动力公司专利>正文

用于自然语言代码搜索的系统和方法技术方案

技术编号:41183605 阅读:8 留言:0更新日期:2024-05-07 22:16
实施例涉及将自然语言查询翻译为语义上表示查询的编程语言中的代码片段。实施例包括级联神经网络,其包括编码器网络和分类器网络。编码器网络相较于分类器网络快但准确性低。使用对比学习框架来训练编码器网络,以从大的代码片段集合中识别代码候选。使用二进制分类器来训练分类器网络,以识别在语义上表示来自代码候选的查询的代码片段。

【技术实现步骤摘要】
【国外来华专利技术】

实施例一般涉及机器学习系统和自然语言处理(nlp),并且更具体地涉及使用自然语言来搜索代码片段。


技术介绍

1、人工智能(ai)模型已经广泛用于各种应用中。一些ai模型可用于响应于自然语言输入以搜索和/或生成编程语言中的代码片段。例如,自然语言输入可以描述诸如“过滤在邮政编码94070处出现的销售记录”的函数,并且ai模型可以生成或搜索实现该函数的代码段(例如,在python、c#等中)。现有的代码生成系统集中于提高自然语言搜索的速度或提高自然语言搜索的准确性。然而,这些现有的自然语言搜索方法在很大程度上难以在搜索的效率和穷尽性之间进行权衡。


技术实现思路

【技术保护点】

1.一种用于将自然语言查询翻译为编程语言中的代码片段的方法,所述方法包括:

2.根据权利要求1所述的方法,还包括:

3.根据权利要求1或2所述的方法,还包括:

4.根据权利要求1至3中任一项所述的方法,其中所述编码器网络相较于所述分类器网络快一个数量级,并且准确性低一个数量级。

5.根据权利要求1至4中任一项所述的方法,其中针对与所述分类器网络不同的损失函数训练所述编码器网络。

6.根据权利要求1至5中任一项所述的方法,其中所述编码器网络与所述分类器网络共享一部分神经网络结构。

7.根据权利要求1至6中任一项所述的方法,其中生成所述代码候选还包括:

8.根据权利要求1至7中任一项所述的方法,其中确定所述代码片段还包括:

9.一种用于将自然语言查询翻译为编程语言中的代码片段的系统,所述系统包括:

10.根据权利要求9所述的系统,其中所述处理器还被配置为:

11.根据权利要求9或10所述的系统,其中所述编码器网络相较于所述分类器网络快一个数量级,并且准确性低一个数量级。

12.根据权利要求9至11中任一项所述的系统,其中所述编码器网络与所述分类器网络共享一部分神经网络结构。

13.根据权利要求9至12中任一项所述的系统,其中为产生所述代码候选,所述处理器还被配置为:

14.根据权利要求9至13中任一项所述的系统,其中为确定所述代码片段,所述处理器还被配置为:

15.一种其上存储有指令的非瞬态计算机可读介质,当由处理器执行时,所述指令使得所述处理器执行用于将自然语言查询翻译为编程语言中的代码片段的操作,所述操作包括:

16.根据权利要求15所述的非瞬态计算机可读介质,还包括:

17.根据权利要求15或16所述的非瞬态计算机可读介质,其中所述编码器网络相较于所述分类器网络快一个数量级,并且准确性低一个数量级。

18.根据权利要求15至17中任一项所述的非瞬态计算机可读介质,其中所述编码器网络与所述分类器网络共享一部分神经网络结构。

19.根据权利要求15至18中任一项所述的非瞬态计算机可读介质,其中生成所述代码候选还包括:

20.根据权利要求15至19中任一项所述的非瞬态计算机可读介质,其中确定所述代码片段还包括:

...

【技术特征摘要】
【国外来华专利技术】

1.一种用于将自然语言查询翻译为编程语言中的代码片段的方法,所述方法包括:

2.根据权利要求1所述的方法,还包括:

3.根据权利要求1或2所述的方法,还包括:

4.根据权利要求1至3中任一项所述的方法,其中所述编码器网络相较于所述分类器网络快一个数量级,并且准确性低一个数量级。

5.根据权利要求1至4中任一项所述的方法,其中针对与所述分类器网络不同的损失函数训练所述编码器网络。

6.根据权利要求1至5中任一项所述的方法,其中所述编码器网络与所述分类器网络共享一部分神经网络结构。

7.根据权利要求1至6中任一项所述的方法,其中生成所述代码候选还包括:

8.根据权利要求1至7中任一项所述的方法,其中确定所述代码片段还包括:

9.一种用于将自然语言查询翻译为编程语言中的代码片段的系统,所述系统包括:

10.根据权利要求9所述的系统,其中所述处理器还被配置为:

11.根据权利要求9或10所述的系统,其中所述编码器网络相较于所述分类器网络快一个数量级,并且准确性低一个数量级。

12.根据权利要求9至...

【专利技术属性】
技术研发人员:A·D·哥特马尔J·李C·H·霍伊
申请(专利权)人:硕动力公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1