验证逻辑形式语言与自然语言的一致性的方法及装置制造方法及图纸

技术编号:39738752 阅读:9 留言:0更新日期:2023-12-17 23:40
本申请提供一种验证逻辑形式语言与自然语言的一致性的方法,包括:利用预先构建的语言模型分析用户输入的第一自然语言,得到

【技术实现步骤摘要】
验证逻辑形式语言与自然语言的一致性的方法及装置


[0001]本申请涉及人工智能
,尤其涉及根据计算的相似度,验证该相似度对应的第一自然语言和与该相似度对应的第二自然语言对应的逻辑形式语言的一致性的方法,更具体地,涉及一种验证逻辑形式语言与自然语言的一致性的方法及装置

介质

设备


技术介绍

[0002]在通用人工智能领域,智能具身需要具备无限任务的能力,不仅可以调用工具去解决实际问题,还需要具备规划的能力,在多个工具中择优形成调用链

一种实现的方式是借助大语言模型的任务拆分能力,将复杂的目标拆分成一个个独立任务,然后在工具集中依次选择适合每个独立任务的工具,上述实现方式不能够验证自然语言与逻辑形式语言的一致性,使得智能具身执行的任务可能偏离实际需求,因此,亟需一种验证逻辑形式语言与自然语言的一致性的方法辅助智能具身准确地完成任务


技术实现思路

[0003]有鉴于此,本申请要解决的技术问题在于提供一种验证逻辑形式语言与自然语言的一致性的方法及装置

介质

设备,解决了现有人工智能领域中不能够验证自然语言与逻辑形式语言的一致性,使得智能具身执行的任务可能偏离实际需求的问题

[0004]为了解决上述技术问题,本申请的具体实施方式提供一种验证逻辑形式语言与自然语言的一致性的方法,包括:利用预先构建的语言模型分析用户输入的第一自然语言,得到
m
个逻辑形式语言,其中,
m
为大于等于1的整数;调用预先构建的
n
个工具描述模板对每个所述逻辑形式语言进行描述,得到
m
个第二自然语言,其中,
n
为大于等于1的整数;计算所述第一自然语言和每个所述第二自然语言之间的相似度;以及根据所述相似度,验证该相似度对应的所述第一自然语言和与该相似度对应的第二自然语言对应的所述逻辑形式语言的一致性

[0005]在一些示例中,分析用户输入的第一自然语言,得到
m
个逻辑形式语言的步骤,包括:对所述第一自然语言进行分词操作,得到分词结果;根据所述分词结果,匹配
m
个执行工具链,生成
m
个有向无环图,其中,每个所述执行工具链包括
g
i
个执行工具,
g
i
为大于等于1的整数,
i
为大于等于且小于等于
m
的整数;将所述
m
个有向无环图中的每个有向无环图转换为数据流的节点序列;以及将每个所述数据流的节点序列作为一个逻辑形式语言,得到
m
个逻辑形式语言

[0006]在一些示例中,,所述
n
个工具描述模板包括搜索类工具描述模板

计算类工具描述模板和动作函数工具描述模板中的至少一个

[0007]在一些示例中,所述搜索类工具描述模板的内容至少包括主语的谓语和实体;所述计算类工具描述模板的内容至少包括主语的计算元素和选择候选集,其中,所述计算元素的值能够根据所述主语的特征计算得到;以及所述动作函数工具描述模板的内容至少包括动词和参数的组合

[0008]在一些示例中,预先构建语言模型的步骤,包括:根据第一训练样本数据集训练神经网络模型的模型参数,将验证合格的所述模型参数作为待应用模型参数进行应用,得到语言模型,其中,所述第一训练样本数据集中的第一训练样本包括自然语言用例和对应的逻辑形式语言标注;或者根据第二训练样本数据集对当前应用的语言模型的模型参数进行微调,将验证合格的微调模型参数作为待应用模型参数进行应用,得到语言模型,其中,所述第二训练样本数据集中的第二训练样本包括未标注的自然语言用例

[0009]在一些示例中,根据第二训练样本数据集对当前应用的语言模型的模型参数进行微调,将验证合格的微调模型参数作为待应用模型参数进行应用,得到语言模型的步骤,包括:根据第二训练样本数据集,利用当前应用的语言模型确定正样本对和负样本对,其中,所述正样本对包括锚例和正例,所述负样本对包括锚例和负例,所述正样本对中的锚例为所述第二训练样本集中的任意第二训练样本,该正样本对中的正例为将该正样本对中的锚例输入当前应用的语言模型后,得到的与该锚例一致的逻辑形式语言,所述负样本对中的锚例为所述第二训练样本集中的任意第二训练样本,该负样本对中的负例为将该负样本对中的锚例输入当前应用的语言模型后,得到的与该锚例不一致的逻辑形式语言;根据所述正样本对和所述负样本对,利用损失函数计算损失值;根据所述损失值确定微调策略;根据所述微调策略调整当前应用的语言模型的模型参数,得到微调模型参数;以及将验证合格的微调模型参数作为待应用模型参数进行应用,得到语言模型

[0010]在一些示例中,根据所述正样本对和所述负样本对,利用损失函数计算损失值的步骤,包括:计算所述锚例与所述正例之间的相似度距离,作为第一距离;计算所述锚例与所述负例之间的相似度距离,作为第二距离;计算所述第一距离

所述第二距离与边缘宽度的加和;以及在所述加和与0两者中取最大的值作为损失函数的损失值

[0011]本申请实施例的另一方面提供了一种验证逻辑形式语言与自然语言的一致性的装置,包括:确定模块,所述确定模块用于执行利用预先构建的语言模型分析用户输入的第一自然语言,得到
m
个逻辑形式语言,其中,
m
为大于等于1的整数;调用模块,所述调用模块用于执行调用预先构建的
n
个工具描述模板对每个所述逻辑形式语言进行描述,得到
m
个第二自然语言,其中,
n
为大于等于1的整数;计算模块,所述计算模块用于执行计算所述第一自然语言和每个所述第二自然语言之间的相似度;以及验证模块,所述验证模块用于执行根据所述相似度,验证该相似度对应的所述第一自然语言和与该相似度对应的第二自然语言对应的所述逻辑形式语言的一致性

[0012]本申请实施例的另一方面提供了一种电子设备,包括一个或多个处理器以及存储装置,其中,上述存储装置用于存储可执行指令,上述可执行指令在被上述处理器执行时,实现本申请实施例的方法

[0013]本申请实施例的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,上述指令在被处理器执行时用于实现本申请实施例的方法

[0014]本申请实施例的另一方面提供了一种计算机程序,上述计算机程序包括计算机可执行指令,上述指令在被执行时用于实现本申请实施例的方法

[0015]本申请的实施例中,通过利用预先构建的语言模型分析用户输入的第一自然语言,可以得到
m
个逻辑形式语言,通过调用预先构建的
...

【技术保护点】

【技术特征摘要】
1.
一种验证逻辑形式语言与自然语言的一致性的方法,其特征在于,包括:利用预先构建的语言模型分析用户输入的第一自然语言,得到
m
个逻辑形式语言,其中,
m
为大于等于1的整数;调用预先构建的
n
个工具描述模板对每个所述逻辑形式语言进行描述,得到
m
个第二自然语言,其中,
n
为大于等于1的整数;计算所述第一自然语言和每个所述第二自然语言之间的相似度;以及根据所述相似度,验证该相似度对应的所述第一自然语言和与该相似度对应的第二自然语言对应的所述逻辑形式语言的一致性
。2.
根据权利要求1所述的验证逻辑形式语言与自然语言的一致性的方法,其特征在于,分析用户输入的第一自然语言,得到
m
个逻辑形式语言的步骤,包括:对所述第一自然语言进行分词操作,得到分词结果;根据所述分词结果,匹配
m
个执行工具链,生成
m
个有向无环图,其中,每个所述执行工具链包括
g
i
个执行工具,
g
i
为大于等于1的整数,
i
为大于等于且小于等于
m
的整数;将所述
m
个有向无环图中的每个有向无环图转换为数据流的节点序列;以及将每个所述数据流的节点序列作为一个逻辑形式语言,得到
m
个逻辑形式语言
。3.
根据权利要求1所述的验证逻辑形式语言与自然语言的一致性的方法,其特征在于,所述
n
个工具描述模板包括搜索类工具描述模板

计算类工具描述模板和动作函数工具描述模板中的至少一个
。4.
根据权利要求3所述的验证逻辑形式语言与自然语言的一致性的方法,其特征在于,所述搜索类工具描述模板的内容至少包括主语的谓语和实体;所述计算类工具描述模板的内容至少包括主语的计算元素和选择候选集,其中,所述计算元素的值能够根据所述主语的特征计算得到;以及所述动作函数工具描述模板的内容至少包括动词和参数的组合
。5.
根据权利要求1所述的验证逻辑形式语言与自然语言的一致性的方法,其特征在于,预先构建语言模型的步骤,包括:根据第一训练样本数据集训练神经网络模型的模型参数,将验证合格的所述模型参数作为待应用模型参数进行应用,得到语言模型,其中,所述第一训练样本数据集中的第一训练样本包括自然语言用例和对应的逻辑形式语言标注;或者根据第二训练样本数据集对当前应用的语言模型的模型参数进行微调,将验证合格的微调模型参数作为待应用模型参数进行应用,得到语言模型,其中,所述第二训练样本数据集中的第二训练样本包...

【专利技术属性】
技术研发人员:赵耀
申请(专利权)人:北京通用人工智能研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1