一种容错计算方法、装置、设备、介质及计算机程序产品制造方法及图纸

技术编号:41854426 阅读:14 留言:0更新日期:2024-06-27 18:30
本发明专利技术涉及人工智能技术领域,具体公开了一种容错计算方法、装置、设备、介质及计算机程序产品,通过利用输入的问题信息中的提示词转换为单词向量输入目标语言模型进行迭代计算的过程中,在进行传播计算中权重矩阵与输入单词向量的计算时,将权重矩阵按行分为多个数据分块,并根据数据分块采用求列元素和的方式计算得到多个冗余向量组成冗余矩阵,利用冗余矩阵与输入单词向量相乘得到的第一校验值对利用权重矩阵和输入单词向量相乘得到的数据计算结果进行检错和纠错,进而在完成目标语言模型各层的传播计算后得到当前迭代计算与问题信息对应的生成结果,保证了生成语言模型的准确性或执行人工智能问答任务时生成回答信息的准确性。

【技术实现步骤摘要】

本专利技术涉及人工智能,特别是涉及一种容错计算方法、装置、设备、介质及计算机程序产品


技术介绍

1、随着人工智能(artificial intelligence,ai)技术的发展,所采用的人工智能模型的规模越来越庞大,导致模型计算过程日益复杂,所需计算单元(processing element,pe)的面积不断增加,从而放大了单个硬件的故障发生率,最终导致模型生成的结果错误。例如,在大语言模型(large language model,llm)的模型计算过程中出现的错误可能会导致生成应答信息不完整、不连续,甚至与问题信息所需的回答相距甚远、出现答非所问的结果。

2、如何提高人工智能模型计算的准确性,是本领域技术人员需要解决的技术问题。


技术实现思路

1、本专利技术的目的是提供一种容错计算方法、装置、设备、介质及计算机程序产品,用于提高人工智能模型计算的准确性。

2、为解决上述技术问题,本专利技术提供一种容错计算方法,应用于人工智能问答,包括:

3、接收输入的问题信息,所述本文档来自技高网...

【技术保护点】

1.一种容错计算方法,其特征在于,应用于人工智能问答,包括:

2.根据权利要求1所述的容错计算方法,其特征在于,将所述权重矩阵按行分为多个数据分块,并根据所述数据分块生成多个不同的冗余向量,将各所述冗余向量组成所述冗余矩阵,包括:

3.根据权利要求2所述的容错计算方法,其特征在于,所述冗余矩阵的构建过程包括通过下式构建行d列的冗余矩阵:

4.根据权利要求3所述的容错计算方法,其特征在于,分别将所述权重矩阵、所述冗余矩阵与当前层的输入单词向量进行通用矩阵乘法计算,对应得到当前层的传播计算的数据计算结果与第一校验值,包括:

5.根据权利要求4所...

【技术特征摘要】

1.一种容错计算方法,其特征在于,应用于人工智能问答,包括:

2.根据权利要求1所述的容错计算方法,其特征在于,将所述权重矩阵按行分为多个数据分块,并根据所述数据分块生成多个不同的冗余向量,将各所述冗余向量组成所述冗余矩阵,包括:

3.根据权利要求2所述的容错计算方法,其特征在于,所述冗余矩阵的构建过程包括通过下式构建行d列的冗余矩阵:

4.根据权利要求3所述的容错计算方法,其特征在于,分别将所述权重矩阵、所述冗余矩阵与当前层的输入单词向量进行通用矩阵乘法计算,对应得到当前层的传播计算的数据计算结果与第一校验值,包括:

5.根据权利要求4所述的容错计算方法,其特征在于,所述数据计算结果未通过校验,包括:

6.根据权利要求4所述的容错计算方法,其特征在于,将所述数据计算结果生成所述第二校验值,包括采用下式递归地计算得到所述数据分块对应的所述第二校验值:

7.根据权利要求1所述的容错计算方法,其特征在于,将所述数据计算结果生成所述第二校验值,包括:

8.根据权利要求4所述的容错计算方法,其特征在于,根据所述第二校验值与对应的所述第一校验值的一致性对比结果对当前层的所述数据计算结果进行校验,包括:

9.根据权利要求2所述的容错计算方法,其特征在于,所述分块因子根据执行当前层的传播计算的计算设备的计算资源以及所述权重矩阵的行数确定,以使所述权重矩阵的行数与所述冗余矩阵的行数之和小于或者等于所述计算设备为当前层的传播计算提供的最大计算资源。

10.根据权利要求1所述的容错计算方法,其特...

【专利技术属性】
技术研发人员:李逍赵雅倩史宏志张亚强高飞陈筱琳许光远
申请(专利权)人:苏州元脑智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1