【技术实现步骤摘要】
本专利技术涉及人工智能,特别是涉及一种容错计算方法、装置、设备、介质及计算机程序产品。
技术介绍
1、随着人工智能(artificial intelligence,ai)技术的发展,所采用的人工智能模型的规模越来越庞大,导致模型计算过程日益复杂,所需计算单元(processing element,pe)的面积不断增加,从而放大了单个硬件的故障发生率,最终导致模型生成的结果错误。例如,在大语言模型(large language model,llm)的模型计算过程中出现的错误可能会导致生成应答信息不完整、不连续,甚至与问题信息所需的回答相距甚远、出现答非所问的结果。
2、如何提高人工智能模型计算的准确性,是本领域技术人员需要解决的技术问题。
技术实现思路
1、本专利技术的目的是提供一种容错计算方法、装置、设备、介质及计算机程序产品,用于提高人工智能模型计算的准确性。
2、为解决上述技术问题,本专利技术提供一种容错计算方法,应用于人工智能问答,包括:
3、接收
...【技术保护点】
1.一种容错计算方法,其特征在于,应用于人工智能问答,包括:
2.根据权利要求1所述的容错计算方法,其特征在于,将所述权重矩阵按行分为多个数据分块,并根据所述数据分块生成多个不同的冗余向量,将各所述冗余向量组成所述冗余矩阵,包括:
3.根据权利要求2所述的容错计算方法,其特征在于,所述冗余矩阵的构建过程包括通过下式构建行d列的冗余矩阵:
4.根据权利要求3所述的容错计算方法,其特征在于,分别将所述权重矩阵、所述冗余矩阵与当前层的输入单词向量进行通用矩阵乘法计算,对应得到当前层的传播计算的数据计算结果与第一校验值,包括:
...
【技术特征摘要】
1.一种容错计算方法,其特征在于,应用于人工智能问答,包括:
2.根据权利要求1所述的容错计算方法,其特征在于,将所述权重矩阵按行分为多个数据分块,并根据所述数据分块生成多个不同的冗余向量,将各所述冗余向量组成所述冗余矩阵,包括:
3.根据权利要求2所述的容错计算方法,其特征在于,所述冗余矩阵的构建过程包括通过下式构建行d列的冗余矩阵:
4.根据权利要求3所述的容错计算方法,其特征在于,分别将所述权重矩阵、所述冗余矩阵与当前层的输入单词向量进行通用矩阵乘法计算,对应得到当前层的传播计算的数据计算结果与第一校验值,包括:
5.根据权利要求4所述的容错计算方法,其特征在于,所述数据计算结果未通过校验,包括:
6.根据权利要求4所述的容错计算方法,其特征在于,将所述数据计算结果生成所述第二校验值,包括采用下式递归地计算得到所述数据分块对应的所述第二校验值:
7.根据权利要求1所述的容错计算方法,其特征在于,将所述数据计算结果生成所述第二校验值,包括:
8.根据权利要求4所述的容错计算方法,其特征在于,根据所述第二校验值与对应的所述第一校验值的一致性对比结果对当前层的所述数据计算结果进行校验,包括:
9.根据权利要求2所述的容错计算方法,其特征在于,所述分块因子根据执行当前层的传播计算的计算设备的计算资源以及所述权重矩阵的行数确定,以使所述权重矩阵的行数与所述冗余矩阵的行数之和小于或者等于所述计算设备为当前层的传播计算提供的最大计算资源。
10.根据权利要求1所述的容错计算方法,其特...
【专利技术属性】
技术研发人员:李逍,赵雅倩,史宏志,张亚强,高飞,陈筱琳,许光远,
申请(专利权)人:苏州元脑智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。