当前位置: 首页 > 专利查询>英特尔公司专利>正文

为程序合成训练模型的方法和装置制造方法及图纸

技术编号:37914222 阅读:9 留言:0更新日期:2023-06-21 22:36
公开了为程序合成训练模型的方法和装置所公开的示例装置包括至少一个存储器、指令、以及处理器电路。该处理器电路执行指令以对程序的配对采样,程序的配对包括第一程序和第二程序,第一程序包括自然语言描述,计算与程序的配对相对应的程序相似性得分,并且基于与程序的配对中的一些配对相对应的条目来训练模型,条目中的至少一个条目包括自然语言描述中的相应一个和第二程序中与之配对的一个,以及程序相似性得分中的相应一个。程序相似性得分中的相应一个。程序相似性得分中的相应一个。

【技术实现步骤摘要】
为程序合成训练模型的方法和装置


[0001]本公开概括而言涉及机器编程,更具体而言,涉及为程序合成训练模型的方法和装置。

技术介绍

[0002]机器编程(machine programming,MP)与软件开发的自动化有关。例如,程序合成是一种近年来获得关注的MP技术。具体地,遗传算法(genetic algorithm,GA)已越来越多地被实现为程序合成技术,以实现自动的软件构建。对于程序合成系统,通常向系统提供程序行为的规格,以便可以构建和/或生成具有指定行为的程序。许多已知的程序合成系统依赖于输入/输出示例的集合,供程序员指定他们希望程序合成系统创建的程序的行为。根据一些已知的编程合成系统,输入/输出集合的每个元素包含到程序的可能输入,以及相应的期望输出,该输出是通过由合成的程序对输入进行变换而生成的。然而,通过这些技术来合成程序的努力可能是冗长和耗时的。

技术实现思路

[0003]本公开的一个方面提供了一种装置。该装置包括:至少一个存储器;指令;以及处理器电路,用来执行指令以:对程序的配对采样,程序的配对包括第一程序和第二程序,第一程序包括自然语言描述,计算与程序的配对相对应的程序相似性得分,并且基于与程序的配对中的一些配对相对应的条目来训练模型,条目中的至少一个条目包括:自然语言描述中的相应一个和第二程序中与之配对的一个,以及程序相似性得分中的相应一个。
[0004]本公开的另一方面提供了一种非暂态计算机可读介质,包括指令。这些指令当被执行时,使得至少一个处理器:对程序的配对采样,程序的配对包括第一程序和第二程序,第一程序包括自然语言描述;计算与程序的配对相对应的程序相似性得分;并且基于与程序的配对中的一些配对相对应的条目来训练模型,条目中的至少一个条目包括:自然语言描述中的相应一个和第二程序中与之配对的一个,以及程序相似性得分中的相应一个。
[0005]本公开的另一方面提供了一种方法。该方法包括:通过利用至少一个处理器执行指令,来对程序的配对采样,程序的配对包括第一程序和第二程序,第一程序包括自然语言描述;通过利用至少一个处理器执行指令,来计算与程序的配对相对应的程序相似性得分;并且通过利用至少一个处理器执行指令,来基于与程序的配对中的一些配对相对应的条目来训练模型,条目中的至少一个条目包括:自然语言描述中的相应一个和第二程序中与之配对的一个,以及程序相似性得分中的相应一个。
附图说明
[0006]图1是根据本公开的教导的示例程序合成系统的概览。
[0007]图2是根据本公开的教导的示例模型分析系统的框图。
[0008]图3是基于本文公开的示例可以实现的示例神经网络的概览。
[0009]图4是基于本文公开的示例可以实现的另一示例神经网络的概览。
[0010]图5和图6的流程图代表了可由示例处理器电路执行来实现图1的示例程序合成系统和/或图2的示例模型分析系统的示例机器可读指令和/或示例操作。
[0011]图7是示例处理平台的框图,该处理平台包括处理器电路,该处理器电路被构造来执行图5和/或图6的示例机器可读指令和/或示例操作以实现图1的示例程序合成系统和/或图2的示例模型分析系统。
[0012]图8是图7的处理器电路的示例实现方式的框图。
[0013]图9是图7的处理器电路的另一示例实现方式的框图。
[0014]图10是示例软件分发平台(例如,一个或多个服务器)的框图,该示例软件分发平台用于将软件(例如,与图5和图6的示例机器可读指令相对应的软件)分发到与最终用户和/或消费者(例如,用于许可、销售和/或使用)、零售商(例如,用于销售、再销售、许可和/或次级许可)和/或原始设备制造商(OEM)(例如,用于包括在要被分发到例如零售商和/或诸如直接购买客户之类的其他最终用户的产品中)相关联的客户端设备。
[0015]一般而言,相同的标号将在全部(一或多幅)附图和伴随的书面描述的各处被用于指代相同或相似的部件。附图不是按比例的。
[0016]除非另有具体声明,否则本文使用诸如“第一”、“第二”、“第三”等等之类的描述语,而不输入或以其他方式指示出任何优先级、物理顺序、在列表中的排列和/或以任何方式排序的含义,而只是用作标签和/或任意名称来区分元素,以便易于理解所公开的示例。在一些示例中,描述语“第一”在详细描述中可用于提及某一元素,而同一元素在权利要求中可以用不同的描述语来提及,例如“第二”或“第三”。在这种情况下,应当理解,这种描述语仅仅用于明确地标识那些元素,这些元素例如可能在其他情况下共享同一名称。
[0017]如本文所使用的,“基本上实时”指的是以近乎瞬时的方式发生,承认现实世界中可能存在计算时间、传输等等方面的延迟。从而,除非另有指明,否则“基本上实时”指的是实时+/

1秒。如本文所使用的,短语“与
……
通信”——包括其变体——涵盖了直接通信和/或通过一个或多个中间组件进行的间接通信,而不要求直接物理(例如,有线)通信和/或不断的通信,而是还包括按周期性间隔、排定的间隔、非周期性间隔和/或一次性事件的选择性通信。
[0018]如本文所使用的,“处理器电路”被定义为包括(i)一个或多个专用电气电路,其被构造为执行(一个或多个)特定的操作,并且包括一个或多个基于半导体的逻辑器件(例如,由一个或多个晶体管实现的电气硬件),和/或(ii)一个或多个通用的基于半导体的电气电路,其被用指令编程以执行特定操作,并且包括一个或多个基于半导体的逻辑器件(例如,由一个或多个晶体管实现的电气硬件)。处理器电路的示例包括编程的微处理器、可实例化指令的现场可编程门阵列(Field Programmable Gate Array,FPGA)、中央处理器单元(Central Processor Unit,CPU)、图形处理器单元(Graphics Processor Unit,GPU)、数字信号处理器(Digital Signal Processor,DSP)、XPU、或者微控制器和集成电路,例如专用集成电路(Application Specific Integrated Circuit,ASIC)。例如,XPU可以由异构计算系统实现,该计算系统包括多种类型的处理器电路(例如,一个或多个FPGA、一个或多个CPU、一个或多个GPU、一个或多个DSP,等等,和/或这些的组合)以及(一个或多个)应用编程接口(application programming interface,API),这些API可以将(一个或多个)计算任务
指派给该多种类型的处理电路中最适于执行该(一个或多个)计算任务的任何一个(或多个)。
具体实施方式
[0019]公开了为程序合成训练模型的方法和装置。机器编程(MP)与软件开发的自动化有关。例如,遗传算法(GA)已越来越多地被实现为程序合成技术,以实现自动的软件构建。许多已知的程序合成系统依赖于输入/输出示例的集合。然而,利用输入/输出集合进行程本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种装置,包括:至少一个存储器;指令;以及处理器电路,用来执行所述指令以:对程序的配对采样,所述程序的配对包括第一程序和第二程序,所述第一程序包括自然语言描述,计算与所述程序的配对相对应的程序相似性得分,并且基于与所述程序的配对中的一些配对相对应的条目来训练模型,所述条目中的至少一个条目包括:所述自然语言描述中的相应一个和所述第二程序中与之配对的一个,以及所述程序相似性得分中的相应一个。2.如权利要求1中限定的装置,其中,所述条目还包括与所述第二程序中的一个配对的所述第一程序中的相应一个。3.如权利要求1中限定的装置,其中,所述处理器电路执行所述指令以利用遗传算法生成所述第二程序。4.如权利要求1到3中任一项中限定的装置,其中,所述处理器电路执行所述指令以进一步基于输入或者与所述输入相关联的输出中的至少一者来训练所述模型。5.如权利要求4中限定的装置,其中,所述条目中的一些条目还包括所述输入和所述输出,所述输出是通过将所述输入提供给所述第一程序或所述第二程序中的至少一者之一来生成的。6.如权利要求1中限定的装置,其中,所述处理器电路执行所述指令以过滤所述程序的配对。7.如权利要求6中限定的装置,其中,所述处理器电路执行所述指令以通过移除所述程序的配对中具有优势得分的那些配对来过滤所述程序的配对。8.如权利要求1、6或7中任一项中限定的装置,其中,所述处理器电路执行所述指令以经由代码语义相似性算法计算所述程序相似性得分。9.如权利要求1中限定的装置,其中,所述处理器电路执行所述指令以利用长短期记忆(LSTM)神经网络来训练所述模型。10.如权利要求9中限定的装置,其中,所述LSTM神经网络是双向LSTM训练网络。11.一种非暂态计算机可读介质,包括指令,所述指令当被执行时,使得至少一个处理器:对程序的配对采样,所述程序的配对包括第一程序和第二程序,所述第一程序包括自然语言描述;计算与所述程序的配对相对应的程序相似性得分;并且基于与所述程序的配对中的一些配对相对应的条目来训练模型,所述条目中的至少一个条目包括:所述自然语言描述中的相应一个和所述第二程序中与之配对的一个,以及所述程序相似性得分中的相应一个。12.如权利要求11中限定的计算机可读介质,其中,所述条目中的一些条目还包括与所
述第二程序中的一个配对的所述第一程序中的相应一个。13.如权利要求11或...

【专利技术属性】
技术研发人员:托德
申请(专利权)人:英特尔公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1