一种自然语言编程方法、装置、设备及存储介质制造方法及图纸

技术编号:35879389 阅读:28 留言:0更新日期:2022-12-07 11:18
本发明专利技术公开了一种自然语言编程方法、装置、设备及存储介质,方法包括:获取待编程的自然语言文本;计算自然语言文本分别与预先构建的业务逻辑ID关联表中的每一业务逻辑功能描述文本的第一相似度;当最高的第一相似度大于预设的相似度阈值时,获取第一相似度最高的业务逻辑功能描述文本对应的业务逻辑ID;从预先构建的业务逻辑库中,查找与对应的业务逻辑ID对应的xml文件,并返回xml文件,以利用xml文件对自然语言文本进行编程;其中,业务逻辑库中包括若干与业务逻辑ID对应的xml文件,xml文件包括业务逻辑的数据结构。采用本发明专利技术实施例能够实现自然语言的编程,算力要求低,同时适用各种不同的场景。各种不同的场景。各种不同的场景。

【技术实现步骤摘要】
一种自然语言编程方法、装置、设备及存储介质


[0001]本专利技术涉及计算机
,尤其涉及一种自然语言编程方法、装置、设备及存储介质。

技术介绍

[0002]为了驱动计算机运行,需要编程语言。在目前流行的编程工具中,大部分是可编译为机器语言的高级语言,而非人们使用的自然语言,如C#、JavaScript、VB、C、C++、PASCAL、JAVA等语言,其语法是从“机器语言”、“汇编语言”、“高级语言”这样逐步发展起来的,然而这些编程语言需要用户学习和理解才能够使用,因此通过自然语言例如中文进行编程,成为了目前研究的重点。

技术实现思路

[0003]本专利技术实施例的目的是提供一种自然语言编程方法、装置、设备及存储介质,通过利用生成的业务逻辑进行自然语言的编程,算力要求低,能够适用各种不同的场景。
[0004]为实现上述目的,本专利技术实施例提供了一种自然语言编程方法,包括:获取待编程的自然语言文本;计算所述自然语言文本分别与预先构建的业务逻辑ID关联表中的每一业务逻辑功能描述文本的第一相似度;其中,所述业务逻辑ID关联表中包括若干业务逻辑ID,及与所述业务逻辑ID对应的业务逻辑功能描述文本;当最高的所述第一相似度大于预设的相似度阈值时,获取第一相似度最高的所述业务逻辑功能描述文本对应的业务逻辑ID;从预先构建的业务逻辑库中,查找与所述对应的业务逻辑ID对应的xml文件,并返回所述xml文件,以利用所述xml文件对所述自然语言文本进行编程;其中,所述业务逻辑库中包括若干与所述业务逻辑ID对应的xml文件,所述xml文件包括业务逻辑的数据结构。
[0005]作为上述方案的改进,通过以下步骤构建所述业务逻辑ID关联表:获取设计好的组件;其中,所述组件的结构包括:组件ID、组件名称、组件类别、组件内容、组件入参、组件出参及组件描述文本;利用所述组件,构建业务逻辑;其中,所述业务逻辑的结构包括:业务逻辑ID、业务逻辑名称、业务逻辑类别、业务逻辑内容、业务逻辑入参、业务逻辑出参及业务逻辑功能描述文本;利用所述业务逻辑ID及所述业务逻辑功能描述文本,得到业务逻辑ID关联表。
[0006]作为上述方案的改进,所述自然语言编程方法还包括:当最高的所述第一相似度小于或等于所述相似度阈值时,获取所述自然语言文本的若干关键词;利用预先训练好的组件索引模型,获取每一所述关键词对应的组件ID;对于每一所述组件ID,利用预先训练好的ID关联模型,获取含有所述组件ID的所
有业务逻辑ID,统计所有所述业务逻辑ID的总数量;计算所述自然语言文本分别与含有每一所述组件ID的每一所述业务逻辑ID的业务逻辑功能描述文本的第二相似度;根据所述总数量和所述第二相似度,计算得到含有每一所述组件ID的每一所述业务逻辑ID的分值;当仅存在一个最高所述分值,且最高所述分值大于或等于预设的分值阈值时,返回分值最高的业务逻辑ID对应的xml文件。
[0007]作为上述方案的改进,通过以下步骤得到训练好的组件索引模型:将预先构建的组件ID关联表作为数据源,采用FST数据结构,得到训练好的组件索引模型;其中,所述组件ID关联表中包括若干组件ID,及与所述组件ID对应的关键词。
[0008]作为上述方案的改进,通过以下步骤构建组件ID关联表:对所述组件描述文本进行拆词处理,得到所述组件的关键词;利用所述组件ID及所述组件的关键词,得到组件ID关联表。
[0009]作为上述方案的改进,通过以下步骤得到训练好的ID关联模型:将预先构建的ID关联表作为数据源,采用键值对数据结构,得到训练好的ID关联模型;其中,所述ID关联表中包括若干组件ID,及与所述组件ID对应的业务逻辑ID。
[0010]作为上述方案的改进,所述自然语言编程方法还包括:当存在两个或两个以上最高所述分值,或最高所述分值小于所述分值阈值时,选取所述分值最高的前m个业务逻辑进行分解,得到若干组件;其中,m>1;将所述组件中数量最多的组件作为终点组件,根据其余所述组件出现在所述终点组件的前一位的频次,确定所述终点组件的前一位组件,将所述前一位组件更新为所述终点组件,继续确定所述终点组件的前一位组件,直至所述终点组件不存在前一位组件,得到位于数量最多的组件之前的所有组件;将所述组件中数量最多的组件作为起点组件,根据其余所述组件出现在所述起点组件的后一位的频次,确定所述起点组件的后一位组件,将所述后一位组件更新为起点组件,继续确定所述起点组件的后一位组件,直至所述起点组件不存在后一位组件,得到位于数量最多的组件之后的所有组件;利用数量最多的组件之前的所有组件、数量最多的组件和数量最多的组件之后的所有组件,构成新的业务逻辑;对新的业务逻辑进行验证,返回验证正确的业务逻辑的xml文件。
[0011]为实现上述目的,本专利技术实施例还提供了一种自然语言编程装置,包括控制器,所述控制器被配置为:获取待编程的自然语言文本;计算所述自然语言文本分别与预先构建的业务逻辑ID关联表中的每一业务逻辑功能描述文本的第一相似度;其中,所述业务逻辑ID关联表中包括若干业务逻辑ID,及与所述业务逻辑ID对应的业务逻辑功能描述文本;当最高的所述第一相似度大于预设的相似度阈值时,获取第一相似度最高的所述业务逻辑功能描述文本对应的业务逻辑ID;从预先构建的业务逻辑库中,查找与所述对应的业务逻辑ID对应的xml文件,并返
回所述xml文件,以利用所述xml文件对所述自然语言文本进行编程;其中,所述业务逻辑库中包括若干与所述业务逻辑ID对应的xml文件,所述xml文件包括业务逻辑的数据结构。
[0012]为实现上述目的,本专利技术实施例还提供了一种电子设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器在执行所述计算机程序时实现如上述所述的自然语言编程方法。
[0013]为实现上述目的,本专利技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序;其中,所述计算机程序在运行时控制所述计算机可读存储介质所在的设备执行如上述所述的自然语言编程方法。
[0014]与现有技术相比,本专利技术实施例提供的一种自然语言编程方法、装置、设备及存储介质,通过获取待编程的自然语言文本;计算所述自然语言文本分别与预先构建的业务逻辑ID关联表中的每一业务逻辑功能描述文本的第一相似度;其中,所述业务逻辑ID关联表中包括若干业务逻辑ID,及与所述业务逻辑ID对应的业务逻辑功能描述文本;当最高的所述第一相似度大于预设的相似度阈值时,获取所述第一相似度最高的所述业务逻辑功能描述文本对应的业务逻辑ID;从预先构建的业务逻辑库中,查找并返回与所述对应的业务逻辑ID对应的xml文件,以利用所述xml文件对所述自然语言文本进行编程,本专利技术实施例算力要求低,能够适用各种不同的场景。
附图说明
[0015]图1是本专利技术实施例提供的一种自然语言编程方法的流程图;图2是本专利技术施例提供的一种FST结构图;图3是本专利技术施例提供的又一种FST结构图;图4是本发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自然语言编程方法,其特征在于,包括:获取待编程的自然语言文本;计算所述自然语言文本分别与预先构建的业务逻辑ID关联表中的每一业务逻辑功能描述文本的第一相似度;其中,所述业务逻辑ID关联表中包括若干业务逻辑ID,及与所述业务逻辑ID对应的业务逻辑功能描述文本;当最高的所述第一相似度大于预设的相似度阈值时,获取第一相似度最高的所述业务逻辑功能描述文本对应的业务逻辑ID;从预先构建的业务逻辑库中,查找与所述对应的业务逻辑ID对应的xml文件,并返回所述xml文件,以利用所述xml文件对所述自然语言文本进行编程;其中,所述业务逻辑库中包括若干与所述业务逻辑ID对应的xml文件,所述xml文件包括业务逻辑的数据结构。2.如权利要求1所述的自然语言编程方法,其特征在于,通过以下步骤构建所述业务逻辑ID关联表:获取设计好的组件;其中,所述组件的结构包括:组件ID、组件名称、组件类别、组件内容、组件入参、组件出参及组件描述文本;利用所述组件,构建业务逻辑;其中,所述业务逻辑的结构包括:业务逻辑ID、业务逻辑名称、业务逻辑类别、业务逻辑内容、业务逻辑入参、业务逻辑出参及业务逻辑功能描述文本;利用所述业务逻辑ID及所述业务逻辑功能描述文本,得到业务逻辑ID关联表。3.如权利要求2所述的自然语言编程方法,其特征在于,所述自然语言编程方法还包括:当最高的所述第一相似度小于或等于所述相似度阈值时,获取所述自然语言文本的若干关键词;利用预先训练好的组件索引模型,获取每一所述关键词对应的组件ID;对于每一所述组件ID,利用预先训练好的ID关联模型,获取含有所述组件ID的所有业务逻辑ID,统计所有所述业务逻辑ID的总数量;计算所述自然语言文本分别与含有每一所述组件ID的每一所述业务逻辑ID的业务逻辑功能描述文本的第二相似度;根据所述总数量和所述第二相似度,计算得到含有每一所述组件ID的每一所述业务逻辑ID的分值;当仅存在一个最高所述分值,且最高所述分值大于或等于预设的分值阈值时,返回分值最高的业务逻辑ID对应的xml文件。4.如权利要求3所述的自然语言编程方法,其特征在于,通过以下步骤得到训练好的组件索引模型:将预先构建的组件ID关联表作为数据源,采用FST数据结构,得到训练好的组件索引模型;其中,所述组件ID关联表中包括若干组件ID,及与所述组件ID对应的关键词。5.如权利要求4所述的自然语言编程方法,其特征在于,通过以下步骤构建组件ID关联表:对所述组件描述文本进行拆词处理,得到所述组件的关键词;利用所述组件ID及所述组件的关键词,得到组件ID关联表。
6.如...

【专利技术属性】
技术研发人员:苏炜石慧芳张熙陈小辉梁少林李正权李洁儒李保津
申请(专利权)人:广东省科技基础条件平台中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1