一种生成式自然语言模型和外界环境交互的方法、装置和存储介质制造方法及图纸

技术编号:38386429 阅读:10 留言:0更新日期:2023-08-05 17:41
生成式自然语言模型(Generative Natural Language Model),是一种基于庞大数量的自然语言文本作为训练数据集的深度神经网络,虽然生成式自然语言模型可以做到与人类对话几乎无异的交流,甚至是上下文联动,但是其并不能与外界环境交互,而且任何没有参与训练的知识均不能进行回答。创建一个有着特定输出格式且易于程序解析的生成式自然语言模型无论在人力还是财力上均是很难实现的。所以,本发明专利技术创造性地通过经过精密构造的“预置初始化语句”以及“预置程序”实现了生成式自然语言模型和外界交互的功能,打破了生成式自然语言模型的文字壁垒。文字壁垒。文字壁垒。

【技术实现步骤摘要】
一种生成式自然语言模型和外界环境交互的方法、装置和存储介质


[0001]本专利技术涉及计算机
,尤其涉及一种生成式自然语言模型和外界环境交互的方法、装置和存储介质。

技术介绍

[0002]随着机器学习(尤其是深度学习)的发展、以及计算机数据处理能力的提升,越来越多复杂的计算模型呈现在世人面前。
[0003]生成式自然语言模型(Generative Natural Language Model),是一种基于庞大数量的自然语言文本作为训练数据集的深度神经网络,训练样本(或称数据集)往往涵盖了很多学科的内容,并可实现跨学科联动。
[0004]特别是在使用Transformer深度神经网络架构的情况下,可以实现对文字很高的理解程度,尤其是GPT(Generative Pretrained Transformer)网络。
[0005]在实践过程中,虽然生成式自然语言模型可以做到与人类对话几乎无异的交流,甚至是上下文联动,但是其并不能与外界环境交互,而且任何没有参与训练的知识均不能进行回答。
[0006]如果想要创建一个有着特定输出格式且易于程序解析的生成式自然语言模型,那就无法在庞大的无标签的自然文本数据集上使用无监督学习(Unsupervised Learning)的方式进行训练,必须通过人工创建或标注数亿行的数据集的方式才可能实现,这无论在人力还是财力上均是很难实现的。
[0007]另外,GPT一般需要庞大的计算资源才可以训练,如果每次增加新的知识内容都需要重复训练的话,无论从经济角度还是环保角度均是十分糟糕的。
[0008]所以,目前即使生成式自然语言模型可以有很强大的自然语言交互能力和理解能力,但是其不能和外界环境交互,无法提供用于其训练任务的数据集意外的知识内容。

技术实现思路

[0009]随着支持自然语言输入的模型的出现,提示词工程(Prompt Engineering)成为计算机领域一个新兴的研究方向,领域内普通技术人员通过使用自然语言巧妙构造模型输入,从而使模型输出达到预期效果。
[0010]本申请创造性地提出了一种生成式自然语言模型和外界环境交互的方法、装置和存储介质,通过巧妙地通过提示词工程构造模型的上下文,使生成式自然语言模型可以很容易地和“预置程序”进行交互从而间接实现对生成式自然语言模型之外的环境进行交互,并且可以通过上下文联动的方法实时更新自身知识库,无需自行创建或标注庞大的数据集,更无需耗费巨大的人力或财力重新训练生成式自然语言模型。
[0011]和以往的“智能助理”不同的是,使用了本申请所述方法之后,人类的自然语言输入无需明确指出需要访问的设备、或对象,生成式语言模型可以根据上下文自动判断其需
要访问的设备、或对象,在具体实施例中将展开说明。
[0012]为实现上述目的,本申请提供了一种生成式自然语言模型和外界环境交互的方法、装置和存储介质的技术方案,具体如下:
[0013]第一方面,包括:步骤S101,将“预置初始化语句”输入生成式自然语言模型,使其后续输出格式为“特定输出格式”;步骤S102,接收人类的自然语言或构造“预置初始化语句”中所定义的特殊指令,与生成式自然语言模型交互;步骤S103,从模型接收使用了“特定输出格式”的文本输出,发送给“预置程序”,并由“预置程序”执行对应的处理策略;
[0014]其中,“预置初始化语句”以自然语言的方式对后续与生成式自然语言模型的交互内容或方式进行限定,包括但不限于:对于后续必须使用“预置初始化语句”中规定的格式交换信息的限定、对禁止后续输出人类自然语言的限定、对于周边设备或接口初始状态的描述;
[0015]所述“特定输出格式”为有简单语义结构且易于传统计算机程序通过正则表达式格式、或前缀、或枚举类型等方式解析的文本,可以包含打开、或关闭、或访问、或创建、或读取、或加载、或输入输出等指令;
[0016]所述“预置程序”可以通过解析模型以“特定输出格式”输出的文本信息获取模型当前想要交互的周边设备、互联网、或其它接口,并按照语义内容对交互对象进行访问。
[0017]根据本申请第一方面所述的方法,本申请还提供了第二方面,所述“预置初始化语句”以自然语言的方式对后续与生成式自然语言模型的交互内容或方式进行的限定还包含:对于“添加知识库信号”中包含的新的知识或周边设备信息添加到生成式自然语言模型实例上下文的处理方式的限定,所述新的知识可以为名词的自然语言解释、或数学公式、或事件描述等任何一种自然语言模型可以理解的输入格式的一种或多种。
[0018]根据本申请第二方面所述的方法,本申请还提供了第三方面:随着周围环境变化、或周边设备参数调整、或周边传感器数值变化、或执行步骤S103中所述“对应的处理策略”之后,可能会产生新的知识信息;步骤S301,检测该等新的知识信息产生,在该等信息产生时,执行步骤S302,将该等内容通过以含有“添加知识库信号”的自然语言文本发送给生成式自然语言模型,使生成式自然语言模型的上下文记住新发现的内容。
[0019]根据本申请第二方面所述的方法,本申请还提供了第四方面:所述“预置初始化语句”对于以自然语言的方式对后续与生成式自然语言模型的交互内容或方式的限定还包含:对于其遇到不明白的内容、或上下文中不存在的周边设备、或上下文中不存在的可交互对象输出包含“目标关键词”的“未知知识标识”的限定,其中,所述“目标关键词”为模型目前未知或期望了解的内容,一般为名词;
[0020]通常,在执行步骤S103之前还执行步骤S401,若“预置程序”接收到的文本类型含“未知知识标识”,则尝试在互联网、或本地知识库、或数据库中搜索对应的“目标关键词”,或在扫描周边设备是否包含“目标关键词”中所描述的设备;步骤S402,若执行步骤S401后获得了新的知识、或周边设备信息、或周边设备状态,则将该等内容通过以含有“添加知识库信号”的自然语言文本发送给生成式自然语言模型,使生成式自然语言模型的上下文记住新发现的内容。
[0021]第五方面,本申请还提出了一种生成式自然语言模型和外界环境交互的装置,其特征在于包含以下模块:
[0022]交互模块,用于生成式自然语言模型和外界环境、或用户之间交流;将“预置初始化语句”输入生成式自然语言模型,使其后续输出格式为“特定输出格式”;接收人类的自然语言或构造“预置初始化语句”中所定义的特殊指令,与生成式自然语言模型交互;从模型接收使用了“特定输出格式”的文本输出,发送给执行模块,并由执行模块执行对应的处理策略;
[0023]其中,“预置初始化语句”以自然语言的方式对后续与生成式自然语言模型的交互内容或方式进行限定,包括但不限于:对于后续必须使用“预置初始化语句”中规定的格式交换信息的限定、对禁止后续输出人类自然语言的限定、对于周边设备或接口初始状态的描述;
[0024]所述“特定输出格式”为有简单语义结构且易于传统计算机程序通过正则表达式格式、或前缀、或枚举类型等方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种生成式自然语言模型和外界环境交互的方法,其特征在于,包括:步骤S101,将“预置初始化语句”输入生成式自然语言模型,使其后续输出格式为“特定输出格式”;步骤S102,接收人类的自然语言或构造“预置初始化语句”中所定义的特殊指令,与生成式自然语言模型交互;步骤S103,从模型接收使用了“特定输出格式”的文本输出,发送给“预置程序”,并由“预置程序”执行对应的处理策略;其中,“预置初始化语句”以自然语言的方式对后续与生成式自然语言模型的交互内容或方式进行限定,包括但不限于:对于后续必须使用“预置初始化语句”中规定的格式交换信息的限定、对禁止后续输出人类自然语言的限定、对于周边设备或接口初始状态的描述;所述“特定输出格式”为有简单语义结构且易于传统计算机程序通过正则表达式格式、或前缀、或枚举类型等方式解析的文本,可以包含打开、或关闭、或访问、或创建、或读取、或加载、或输入输出等指令;所述“预置程序”可以通过解析模型以“特定输出格式”输出的文本信息获取模型当前想要交互的周边设备、互联网、或其它接口,并按照语义内容对交互对象进行访问。2.根据权利要求1中所述的一种生成式自然语言模型和外界环境交互的方法,所述“预置初始化语句”以自然语言的方式对后续与生成式自然语言模型的交互内容或方式进行的限定还包含:对于“添加知识库信号”中包含的新的知识或周边设备信息添加到生成式自然语言模型实例上下文的处理方式的限定,所述新的知识可以为名词的自然语言解释、或数学公式、或事件描述等任何一种自然语言模型可以理解的输入格式的一种或多种。3.根据权利要求2中所述的一种生成式自然语言模型和外界环境交互的方法,其特征还包括:随着周围环境变化、或周边设备参数调整、或周边传感器数值变化、或执行步骤S103中所述“对应的处理策略”之后,可能会产生新的知识信息;步骤S301,检测该等新的知识信息产生,在该等信息产生时,执行步骤S302,将该等内容通过以含有“添加知识库信号”的自然语言文本发送给生成式自然语言模型,使生成式自然语言模型的上下文记住新发现的内容。4.根据权利要求2中所述的一种生成式自然语言模型和外界环境交互的方法,其特征还包括:所述...

【专利技术属性】
技术研发人员:王禹豪
申请(专利权)人:上海小白兔爱吃草文化有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1