北京张量跃迁科技有限公司专利技术

北京张量跃迁科技有限公司共有3项专利

  • 本申请公开了一种模型加载系统及方法,涉及模型加载技术领域。该系统包括:计算节点和存储节点,存储节点包括第一本地盘、第一内存和第一网卡,第一网卡用于与计算节点进行数据交互;计算节点包括图像处理器,并且计算节点运行有推理引擎;存储节点,用于...
  • 本申请公开了一种键值获取方法及装置,应用于大语言模型技术领域。该方法:首先获取待处理提示词对应的待处理token序列,将待处理token序列划分为m段,得到m段token序列。然后确定m段token序列中的目标token序列。接着根据目...
  • 本申请实施例提供了一种大语言模型处理系统及会话处理方法。该系统包括:部署调度器的管理节点、计算节点和存储节点,调度器连接存储节点,存储节点用于直接与计算节点的硬件加速器内存进行数据交互;调度器用于接收到会话请求,且会话请求为多轮会话请求...
1