语言模型的知识更新方法、装置、设备及存储介质制造方法及图纸

技术编号:40947380 阅读:24 留言:0更新日期:2024-04-18 20:20
本申请涉及智能问答领域,提供了一种语言模型的知识更新方法、装置、设备及存储介质。该方法包括:代理模型获取由增强语言模型判定为未作出合理回答的问题,每收到一个问题,在确定该问题是首次请求或者超过第一更新周期的目标问题时,向增强语言模型发送由第三方平台作出的目标回答;在确定问题是非首次请求,且未超过第一更新周期的历史问题时,向增强语言模型发送本地记录的历史回答;再基于预设的更新策略与本地记录的多个问答对进行模型更新,调整增强语言模型的模型参数,以使增强语言模型学习到各问答对关联的相关知识,当增强语言模型再遇到同一问题或者语义表达类似的相似问题时,可直接输出一个合理、准确的回答。

【技术实现步骤摘要】

所属的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。与上述方法实施例基于同一专利技术构思,本申请实施例中还提供了一种计算机设备。在一种实施例中,该计算机设备可以是服务器。在该实施例中,计算机设备的结构如图4所示,可以至少包括存储器401、通讯模块403,以及至少一个处理器402。存储器401,用于存储处理器402执行的计算机程序。存储器401可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统,以及运行即时通讯功能所需的程序等;存储数据区可存储各种即时通讯信息和操作指令集等。存储器401可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,ram);存储器401也可以是非易失性存储器(non-volatilememory),例如只读存储器,快闪存储器(flash memory),硬盘(hard disk本文档来自技高网...

【技术保护点】

1.一种语言模型的知识更新方法,其特征在于,所述方法应用于代理模型,包括:

2.如权利要求1所述的方法,其特征在于,通过执行以下操作,确定所述问题是否为首次请求或者超过第一更新周期的目标问题:

3.如权利要求1所述的方法,其特征在于,在向所述增强语言模型发送由第三方平台作出的目标回答之后,所述方法还包括:

4.如权利要求1所述的方法,其特征在于,所述基于预设的更新策略与本地记录的多个问答对进行模型更新,调整所述增强语言模型的模型参数,包括以下任意一种:

5.一种语言模型的知识更新装置,其特征在于,所述装置应用于代理模型,包括:

...

【技术特征摘要】

1.一种语言模型的知识更新方法,其特征在于,所述方法应用于代理模型,包括:

2.如权利要求1所述的方法,其特征在于,通过执行以下操作,确定所述问题是否为首次请求或者超过第一更新周期的目标问题:

3.如权利要求1所述的方法,其特征在于,在向所述增强语言模型发送由第三方平台作出的目标回答之后,所述方法还包括:

4.如权利要求1所述的方法,其特征在于,所述基于预设的更新策略与本地记录的多个问答对进行模型更新,调整所述增强语言模型的模型参数,包括以下任意一种:

5.一种语言模型的知识更新装置,其特征在于,所述装置应用于代理模型,包括:

6.如权利要求5所述的装置,其特征在于,所述知识回答模块通过执行以下操作,确定所述问题是否为首次请求或者超过第一更新周期的目标问题:

【专利技术属性】
技术研发人员:顾杜娟王星凯
申请(专利权)人:绿盟科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1