北京基流科技股份有限公司专利技术

北京基流科技股份有限公司共有9项专利

  • 本发明提供基于队列对切换的通信方法、装置、设备、介质及程序产品,涉及网络通信技术领域,方法包括:确定待通信的目标节点,确定与目标节点之间的第一可靠连接队列对的状态信息,状态信息至少包括第一可靠连接队列对的状态机取值以及传输失败时间戳;在...
  • 本发明提供一种RDMA网络吞吐量的实时估计方法及系统,属于网络监测技术领域,包括:设置滑动窗口以容纳多个按序排列的工作请求;响应于窗口滑动,确定位于起始端的第一工作请求和位于末端的第二工作请求;获取第一工作请求提交时的第一时间戳,并记录...
  • 本发明涉及资源优化领域,尤其涉及一种LoRA微调的算力资源动态分配方法,通过获取计算集群的显存状态与计算单元负载数据流,依据历史时序数据解析得到表征资源碎片化程度与负载水平的先验特征,并据此为各类计算任务设置瓶颈标签;在任务执行时,依据...
  • 本发明涉及算力调度技术领域,尤其涉及一种基于租户业务优先级的算力动态调度方法,包括:获取目标集群内若干集群租户的业务资源信息,以确定各集群租户的业务优先级;基于业务优先级为各集群租户构建对应的算力账户,并确定各集群租户的账户干涉特征;基...
  • 本发明涉及数据处理技术领域,尤其涉及一种提升GPU算力利用率的自动聚合调度方法:采集GPU运行数据与计算任务集,处理运行数据构建资源信息库,提取计算任务集特征得到标准任务特征并分类生成任务队列;基于资源信息库聚合符合条件的GPU碎片形成...
  • 本发明公开了一种基于队列水位的动态ECN阈值调整方法及系统,所述阈值调整方法包括:生成并管理动态wred profile,维护min_threshold、max_threshold参数;将动态wred profile与具体的数据队列进行...
  • 本发明公开了一种AI算力网络交换机的丢包诊断方法,所述诊断方法包括:步骤S1:网络节点部署与基础配置;步骤S2:丢包检测与镜像触发;步骤S3:报文解析与结构化存储;步骤S4:遥测上报;步骤S5:Collector侧分析与呈现;步骤S6:...
  • 本发明公开了一种自动化AI智能体与环境交互与资源管理方法及系统,包括:拦截并接管智能体与环境的所有交互请求;存储待处理的交互请求,根据预设或动态的调度策略,对请求进行排序和管理,实现请求的异步化处理;将调用发生前的轨迹片段打包成一个部分...
  • 本发明公开了一种基于在线强化学习的大模型投机推理优化方法及系统,所述投机推理优化方法包括:步骤S1:建立原始的大语言模型为目标模型;步骤S2:建立一个参数量小于目标模型的轻量级语言模型,获得草稿模型;步骤S3:比较草稿模型生成的投机词元...
1