System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及人工智能,具体而言,涉及一种数据集的构建方法、语言模型的确定方法和信息处理方法。
技术介绍
1、大模型时代出现了众多的基础语言模型,虽然基础语言模型已经学习到了海量的世界知识,但是当前的世界是一个时刻变化的世界,知识也是日新月异的变化,为了提高基础语言模型的性能需要通过更新的知识对其进行迭代训练,现有技术中往往直接采用更新的知识对语言模型进行训练,但是这种方式存在以下缺点:一是无法高效针对性的注入需要更新的知识,有很多重复知识被执行了训练过程;二是无法保证新知识被语言模型学习,进而使得训练后的语言模型的性能不能得到很好地提升。
2、针对上述在存在知识更新时,直接利用更新的知识对当前的语言模型进行训练,导致训练后的语言模型回复的准确性比较低问题,目前尚未提出有效的解决方案。
技术实现思路
1、本申请实施例提供了一种数据集的构建方法、语言模型的确定方法和信息处理方法,以至少解决在存在知识更新时,直接利用更新的知识对当前的语言模型进行训练,导致训练后的语言模型回复的准确性比较低的技术问题。
2、根据本申请实施例的一个方面,提供了一种数据集的构建方法,包括:获取初始信息集合,并对所述初始信息集合进行预处理,得到所述目标信息集合;获取所述目标信息集合中的目标信息对应的历史信息;依据所述目标信息集合和所述历史信息构建目标训练集,其中,所述目标训练集用于训练得到目标语言模型,所述目标语言模型用于对目标问题信息进行处理,以得到所述目标问题信息的答复信息。
< ...【技术保护点】
1.一种数据集的构建方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,获取所述目标信息集合中的目标信息对应的历史信息包括:
3.根据权利要求2所述的方法,其特征在于,依据所述多个补充后的信息片段和所述初始语言模型,获取所述目标信息和所述目标信息对应的历史信息包括:
4.根据权利要求3所述的方法,其特征在于,若所述判断结果表征所述初始语言模型的信息冲突检测能力不满足所述预设要求之后,所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,依据所述目标信息集合和所述历史信息构建所述目标训练集包括:
6.根据权利要求1所述的方法,其特征在于,对所述初始信息集合进行预处理,得到所述目标信息集合包括:
7.一种语言模型的确定方法,其特征在于,包括:
8.一种信息处理方法,其特征在于,包括:
9.根据权利要求8所述的方法,其特征在于,通过目标语言模型对所述问题信息进行处理,得到所述问题信息的答复信息包括:
10.一种信息处理方法,其特征在于,包括:
1
12.根据权利要求11所述的自动问答系统,其特征在于,所述后台处理模块基于目标语言模型对所述第二问题信息进行处理,得到所述第二问题信息的第二答复信息包括:
13.一种数据集的构建装置,其特征在于,包括:
14.一种语言模型的确定装置,其特征在于,包括:
15.一种信息处理装置,其特征在于,包括:
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至6中任意一项所述的数据集的构建方法,或者,权利要求7所述的语言模型的确定方法,或者,权利要求8至10中任意一项所述的信息处理方法。
17.一种电子设备,其特征在于,包括:
...【技术特征摘要】
1.一种数据集的构建方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,获取所述目标信息集合中的目标信息对应的历史信息包括:
3.根据权利要求2所述的方法,其特征在于,依据所述多个补充后的信息片段和所述初始语言模型,获取所述目标信息和所述目标信息对应的历史信息包括:
4.根据权利要求3所述的方法,其特征在于,若所述判断结果表征所述初始语言模型的信息冲突检测能力不满足所述预设要求之后,所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,依据所述目标信息集合和所述历史信息构建所述目标训练集包括:
6.根据权利要求1所述的方法,其特征在于,对所述初始信息集合进行预处理,得到所述目标信息集合包括:
7.一种语言模型的确定方法,其特征在于,包括:
8.一种信息处理方法,其特征在于,包括:
9.根据权利要求8所述的方法,其特征在于,通过目标语...
【专利技术属性】
技术研发人员:李鹤,余海洋,李永彬,黄非,
申请(专利权)人:浙江阿里巴巴机器人有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。