清昴智能科技北京有限公司专利技术

清昴智能科技北京有限公司共有1项专利

  • 本申请提供一种大语言模型异构算力资源配置伸缩决策方法、系统及介质,包括:获取对应待处理任务的候选策略集合;候选策略集合包括对应待处理任务的多个候选伸缩操作策略;根据待处理任务对应的大型语言模型的模型规模、各个候选伸缩操作策略对应的资源配...
1