请求时间窗口动态调整方法、系统、计算机系统及介质技术方案

技术编号:45414937 阅读:14 留言:0更新日期:2025-06-04 19:02
本发明专利技术涉及一种请求时间窗口动态调整方法、系统、计算机系统及介质,涉及计算机数据处理技术领域。请求时间窗口动态调整方法,包括:获取当前的请求频率,该当前的请求频率包括AI服务大模型当前的服务请求到达频率;获取预设的基础请求时间窗口,该基础请求时间窗口为预设的等待接受一批服务请求的时间长度;获取预设的请求频率和第一调整系数;基于当前的请求频率、基础请求时间窗口、预设的请求频率和第一调整系数计算当前的请求时间窗口;基于计算到的当前的请求时间窗口调整当前请求时间窗口。与现有技术相比,可以在优化计算资源分配的同时,更好地平衡请求处理效率和响应速度,从而满足多客户并发场景下的实际需求。

【技术实现步骤摘要】

本专利技术涉及计算机数据处理,具体涉及一种请求时间窗口动态调整方法、系统、计算机系统及介质


技术介绍

1、随着人工智能技术的发展,大规模模型(如gpt系列模型)已广泛应用于在线问答、搜索推荐和实时推理等场景。多个客户的并发请求的波动对系统的响应能力和资源利用效率提出了严峻挑战。例如,当多个客户同时发起请求时,系统必须快速响应每个请求,否则可能导致延迟增加。如何动态调整时间窗口以高效处理多个客户的并发请求,是提升大模型应用效率的关键。


技术实现思路

1、本申请要解决的技术问题是提供一种请求时间窗口动态调整方法、系统、计算机系统及介质,具有可以在优化计算资源分配的同时,更好地平衡请求处理效率和响应速度,从而满足多客户并发场景下实际需求的特点。

2、第一方面,一种实施例中提供一种请求时间窗口动态调整方法,包括:

3、获取当前的请求频率,所述的当前的请求频率包括ai服务大模型当前的服务请求到达频率;

4、获取预设的基础请求时间窗口,所述基础请求时间窗口为预设的等待接受一批服务请求本文档来自技高网...

【技术保护点】

1.一种请求时间窗口动态调整方法,其特征在于,包括:

2.如权利要求1所述的请求时间窗口动态调整方法,其特征在于,所述的基于所述请求频率、基础请求时间窗口和第一调整系数计算当前的请求时间窗口,包括:

3.如权利要求1或2所述的请求时间窗口动态调整方法,其特征在于,所述的获取第一调整系数,包括:

4.如权利要求3所述的请求时间窗口动态调整方法,其特征在于,所述的基于所述上一服务请求推理时间、基础请求时间窗口和第二调整系数,计算第一调整系数,包括:

5.如权利要求4所述的请求时间窗口动态调整方法,其特征在于,所述的获取第二调整系数,包括:...

【技术特征摘要】

1.一种请求时间窗口动态调整方法,其特征在于,包括:

2.如权利要求1所述的请求时间窗口动态调整方法,其特征在于,所述的基于所述请求频率、基础请求时间窗口和第一调整系数计算当前的请求时间窗口,包括:

3.如权利要求1或2所述的请求时间窗口动态调整方法,其特征在于,所述的获取第一调整系数,包括:

4.如权利要求3所述的请求时间窗口动态调整方法,其特征在于,所述的基于所述上一服务请求推理时间、基础请求时间窗口和第二调整系数,计算第一调整系数,包括:

5.如权利要求4所述的请求时间窗口动态调整方法,其特征在于,所述的获取第二调整系数,包括:

6.如权利要求5所述的请求时间窗口动态调整方法,其特征在于,所述第一阈值为5,第二阈值为0.5,第一数值大于或等于0.1...

【专利技术属性】
技术研发人员:孙月石薪霖肖晓月
申请(专利权)人:熵减成都智能科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1