【技术实现步骤摘要】
业务数据的传输方法及装置、服务器
[0001]本申请实施例涉及计算机领域,具体而言,涉及一种业务数据的传输方法及装置、服务器。
技术介绍
[0002]随着时代科技的进步,人工智能以及云端服务的架构也越来越多,AI(Artificial Intelligence,人工智能)芯片计算平台,具有高兼容、高扩展、高能效、可灵活部署等特性。适用于图像处理、语音识别、金融分析、目标检测、自然语言处理、智能推荐等典型AI应用场景。随着AI算力需求激增,数据海量增长与模型巨量化发展,AI芯片产业格局正呈现多元化发展趋势为了提高显示适配器加速运算的能力,OCP(Open Computer Project,开放计算项目)协会推出了OAI(Open Accelerator Infrastructure,开放加速器基础设施)系统架构,定义了开放加速标准(OAM,OCP Accelerator Module),可以有效提升上述的功能。
[0003]在现有的OAI架构上,多个OAM模块连接至Switch(交换机),再由Switch连接至HOST(服务机)端(例如CPU(Central Processing Unit,中央处理器)),由HOST端对OAM模块进行控制,从而满足AI运算需求,但是当前的OAI架构中,OAM模块和HOST端会发生掉卡导致OAM模块和HOST端无法进行业务数据的传输,此时们只能重新启动让HOST端的CPU重新链接OAM装置,由于伺服器重新开启并链接的时间很长,会导致重启这段期间的浪费,且因为OAM拆装不易,要检查 ...
【技术保护点】
【技术特征摘要】
1.一种业务数据的传输方法,其特征在于,应用于处理器,所述业务数据的传输方法包括:在检测到所述处理器与第一业务模块之间的第一业务传输链路处于故障状态的情况下,确定第二业务模块,其中,所述处理器,所述第一业务模块和所述第二业务模块部署在服务器上,所述处理器与每个业务模块之间建立了业务传输链路和消息传输链路,所述业务传输链路用于传输业务数据,所述消息传输链路用于传输消息指令,所述第二业务模块所对应的第二业务传输链路处于工作状态;通过所述第一业务模块对应的第一消息传输链路向所述第一业务模块传输第一消息指令,并通过所述第二业务模块对应的第二消息传输链路向所述第二业务模块传输第二消息指令,其中,所述第一消息指令和所述第二消息指令均用于指示建立所述第一业务模块与所述第二业务模块之间的数据传输链路;通过所述数据传输链路和所述第二业务传输链路,传输与所述第一业务模块之间的业务数据。2.根据权利要求1所述的方法,其特征在于,所述确定第二业务模块,包括:从所述服务器上部署的多个业务模块中筛选出第三业务模块,其中,所述第三业务模块与所述第一业务模块之间通过算力分享链路连接,并且所述第三业务模块所对应的第三业务传输链路处于工作状态,所述算力分享链路用于实现业务模块之间分享算力;从所述第三业务模块中筛选出业务量小于目标业务量的业务模块作为所述第二业务模块。3.根据权利要求1所述的方法,其特征在于,所述通过所述第一业务模块对应的第一消息传输链路向所述第一业务模块传输第一消息指令,并通过所述第二业务模块对应的第二消息传输链路向所述第二业务模块传输第二消息指令,包括:生成携带有第一状态信息和第一业务模块信息的所述第一消息指令,以及生成携带有第二状态信息和第二业务模块信息的所述第二消息指令,其中,所述第一状态信息用于指示所述第一业务模块与所述处理器之间的所述业务传输链路处于故障状态,所述第一业务模块信息用于指示所述第二业务模块,所述第二状态信息用于指示所述第二业务模块与所述处理器之间的所述业务传输链路处于工作状态,所述第二业务模块信息用于指示所述第一业务模块;通过所述第一消息传输链路传输所述第一消息指令,并通过所述第二消息传输链路传输所述第二消息指令。4.根据权利要求1所述的方法,其特征在于,所述通过所述数据传输链路和所述第二业务传输链路,传输与所述第一业务模块之间的业务数据,包括以下至少之一:通过所述第二业务传输链路将第一业务数据传输至所述第二业务模块,其中,所述第一业务数据用于指示所述第二业务模块通过所述数据传输链路将所述第一业务数据传输至所述第一业务模块;接收所述第二业务传输链路传输的第二业务数据,其中,所述第二业务数据是所述第一业务模块通过所述数据传输链路传输至所述第二业务模块的,所述第二业务数据用于指示所述第二业务模块将所述第二业务数据传输至所述处理器。5.一种业务数据的传输方法,其特征在于,应用于第一业务模块,所述业务数据的传输
方法包括:接收处理器通过所述第一业务模块对应的第一消息传输链路向所述第一业务模块传输的第一消息指令,其中,所述处理器,所述第一业务模块和第二业务模块部署在服务器上,所述处理器与每个业务模块之间建立了业务传输链路和消息传输链路,所述业务传输链路用于传输业务数据,所述消息传输链路用于传输消息指令,所述第一消息指令为在所述处理器检测到与所述第一业务模块之间的第一业务传输链路处于故障状态,并确定出所述第二业务模块的情况下传输的,所述第二业务模块所对应的第二业务传输链路处于工作状态,所述第一消息指令用于指示建立所述第一业务模块与所述第二业务模块之间的数据传输链路;响应所述第一消息指令,建立与所述第二业务模块之间的所述数据传输链路;通过所述数据传输链路和所述第二业务传输链路,传输与所述处理器之间的业务数据。6.根据权利要求5所述的方法,其特征在于,所述响应所述第一消息指令,建立与所述第二业务模块之间的所述数据传输链路,包括:根据所述第一消息指令从与所述第一业务模块通过算力分享链路连接的业务模块中确定出所述第二业务模块;将与所述第二业务模块之间连接的目标算力分享链路转换为所述数据传输链路,其中,所述目标算力分享链路用于实现所述第二业务模块和所述第一业务模块之间分享算力。7.根据权利要求6所述的方法,其特征在于,所述根据所述第一消息指令从与所述第一业务模块通过算力分享链路连接的业务模块中确定出所述第二业务模块,包括:识别所述第一消息指令中携带的第一状态信息,其中,所述第一状态信息用于指示所述第一业务模块与所述处理器之间的所述业务传输链路的工作状态;在所述第一状态信息用于指示所述第一业务模块与所述处理器之间的所述业务传输链路处于故障状态的情况下,将所述第一消息指令中携带的第一业务模块信息所指示的业务模块确定为所述第二业务模块。8.根据权利要求6所述的方法,其特征在于,所述将与所述第二业务模块之间连接的目标算力分享链路转换为所述数据传输链路,包括:获取预先存储的目标数据传输协议;将所述目标算力分享链路上所采用的传输协议转换为所述目标数据传输协议,得到所述数据传输链路。9.一种业务数据的传输方法,其特征在于,应用于第二业务模块,所述业务数据的传输方法包括:接收处理器通过所述第二业务模块对应的第二消息传输链路向所述第二业务模块传输的第二消息指令,其中,所述处理器,第一业务模块和所述第二业务模块部署在服务器上,所述处理器与每个业务模块之间建立了业务传输链路和消息传输链路,所述业务传输链路用于传输业务数据,所述消息传输链路用于传输消息指令,所述第二消息指令为在所述处理器检测到与所述第一业务模块之间的第一业务传输链路处于故障状态,并确定出所述第二业务模块的情况下传输的,所述第二业务模块所对应的第二业务传输链路处于工作
状态,所述第二消息指令用于指示建立所述第一业务模块与所述第二业务模块之间的数据传输链路;响应所述第二消息指令,建立与所述第一业务模块之间的所述数据传输链路;通过所述数据传输链路和所述第二业务传输链路,传输所述第一业务模块与所述处理器之间的业务数据。10.根据权利要求9所述的方法,其特征在于,所述响应所述第二消息指令,建立与所述第一业务模块之间的所述数据传输链路,包括:根据所述第二消息指令从与所述第二业务模块通过算力分享链路连接的业务模块中确定出所述第一业务模块;将与所述第一业务模块之间连接的目标算力分享链路转换为所述数据传输链路,其中,所述目标算力分享链路用于实现所述第二业务模块和所述第一业务模块之间分享算力。11.根据权利要求10所述的方法,其特征在于,所述根据所述第二消息指令从与所述第二业务模块通过算力分享链路连接的业务模块中确定出所述第一业务模块,包括:识别所述第二消息指令中携带的第二状态信息,其中,所述第二状态信息用于指示所述第二业务模块与所述处理器之间的所述业务传输链路的工作状态;在所述第二状态信息用于指示所述...
【专利技术属性】
技术研发人员:廖晟辉,
申请(专利权)人:苏州浪潮智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。