温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本公开提供了一种推理服务方法、处理装置、设备、存储介质和程序产品,涉及人工智能技术领域。其中,大模型推理服务方法包括:监测所述多个解码节点的第一算力资源以及监测预填充节点与解码节点之间的迁移链路的性能指标;响应于大模型推理任务,将推理任务分...该专利属于中国电信股份有限公司技术创新中心所有,仅供学习研究参考,未经过中国电信股份有限公司技术创新中心授权不得商用。
温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本公开提供了一种推理服务方法、处理装置、设备、存储介质和程序产品,涉及人工智能技术领域。其中,大模型推理服务方法包括:监测所述多个解码节点的第一算力资源以及监测预填充节点与解码节点之间的迁移链路的性能指标;响应于大模型推理任务,将推理任务分...