System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开涉及计算机,具体涉及一种网络资源管理方法、装置、设备及介质。
技术介绍
1、随着大型预训练语言模型的兴起,如bert、gpt、文心一言等,语言模型作为服务的方式日益普及。用户可以通过api接口调用各种语言模型实现文本生成、情感分析、问答等多种智能应用。
2、现有技术中,语言模型运算成本高昂,计算资源需求大,但缺乏流量访问使用控制。同时,峰值使用量可能超出流量资源限制,需要进行限流保护。
3、目前业内尚无成熟的模型使用流量配额管理方案,迫切需要一种能在模型访问时对流量资源进行精准科学配额的方法。
技术实现思路
1、本公开提供一种网络资源管理方法、装置、设备及介质,用以解决现有技术中访问语言模型无法精确进行流量配额的方法。
2、第一方面,本公开提供一种网络资源管理方法,包括:
3、获取第一终端属性,所述第一终端为用户端,根据机器学习算法为不同属性的第一终端动态定制资源配额策略,资源配额策略包括访问模型以及对应的访问时长、频率和资源配额;
4、根据第一终端和第二终端的状态,所述第二终端为多模型集成的网络流量配额管理终端,实时调整滑动窗口大小,分别获取第一终端和第二终端统计的资源访问量,根据第一终端和第二终端统计的资源访问量计算实际资源访问量;
5、当实际资源访问量与资源配额的比值大于预警阈值后,第一终端延迟预设时长发送周期性预警请求,请求第二终端判断实际资源访问量是否超过资源配额;
6、如果实际资源
7、根据本公开提供的网络资源管理方法,通过第一终端的用户日志获取预设时间段内第一终端的历史资源访问记录,所述访问记录包括第一终端历史访问模型的各个子模块以及各个子模块对应的访问时长、频率、资源访问量,根据各个子模块对应的访问时长、频率、资源访问量计算第一终端的资源配额。
8、根据本公开提供的网络资源管理方法,当第一终端处于启动阶段时,第一终端的滑动窗口大小随时间呈线性增长,第二终端的窗口大小保持不变;
9、当第二终端处于网络拥塞状态时,根据网络拥塞情况调整滑动窗口大小,网络越拥塞,第一终端和第二终端的滑动窗口越小。
10、根据本公开提供的网络资源管理方法,分别获取第一终端统计的资源访问量x和第二终端统计的资源访问量y;
11、分别设置第一终端的置信度m和第二终端的置信度n,根据下述加权公式计算实际资源访问量s:
12、。
13、根据本公开提供的网络资源管理方法,第二终端接收第一终端延迟预设时长发送的周期性预警请求,并放入第二终端的延迟队列,按照请求先进先出的顺序处理请求,并判断实际资源访问量是否超过资源配额。
14、根据本公开提供的网络资源管理方法,根据第一终端属性分别进行访问时长、频率和配额的限流;
15、获取访问模型各个子模块的热度,热度越高,限流策略越严格。
16、根据本公开提供的网络资源管理方法,当超过第一阈值时,向第一终端以第一频率发送包含实际资源访问量、资源配额、扩容建议的预警邮件;
17、当超过第二阈值时,向第一终端以第二频率发送包括实际资源访问量趋势的预警短信;
18、当超过第三阈值时,向第一终端以第三频率弹出使用量警告弹窗,弹窗中呈现配额剩余资源访问量;
19、所述第二阈值大于第一阈值且小于第三阈值;
20、所述第二频率大于第一频率且小于第三频率。
21、第二方面,本公开还提供一种网络资源管理装置,包括:
22、资源配额模块:获取第一终端属性,所述第一终端为用户端,根据机器学习算法为不同属性的第一终端动态定制资源配额策略,资源配额策略包括访问模型以及对应的访问时长、频率和资源配额;
23、计算模块:根据第一终端和第二终端的状态,所述第二终端为多模型集成的网络流量配额管理终端,实时调整滑动窗口大小,分别获取第一终端和第二终端统计的资源访问量,根据第一终端和第二终端统计的资源访问量计算实际资源访问量;
24、判断模块:当实际资源访问量与资源配额的比值大于预警阈值后,第一终端延迟预设时长发送周期性预警请求,请求第二终端判断实际资源访问量是否超过资源配额;
25、限流模块:如果实际资源访问量超过资源配额,根据第一终端属性、访问模型类型以及超出阈值,设置多级预警方式。
26、与现有技术相比,本公开获取第一终端属性,根据机器学习算法为不同属性的第一终端动态定制资源配额策略,资源配额策略包括访问模型以及对应的访问时长、频率和资源配额;根据第一终端和第二终端的状态,实时调整滑动窗口大小,分别获取第一终端和第二终端统计的资源访问量,根据第一终端和第二终端统计的资源访问量计算实际资源访问量;当实际资源访问量与资源配额的比值大于预警阈值后,第一终端延迟预设时长发送周期性预警请求,请求第二终端判断实际资源访问量是否超过资源配额;如果实际资源访问量超过资源配额,根据第一终端属性、访问模型类型以及超出阈值,设置多级预警方式。通过采用上述方案,能够科学、精准地对模型访问流量进行配额管理。
本文档来自技高网...【技术保护点】
1.一种网络资源管理方法,其特征在于,包括:
2.根据权利要求1所述的网络资源管理方法,其特征在于,所述机器学习算法包括:
3.根据权利要求1所述的网络资源管理方法,其特征在于:所述实时调整滑动窗口大小包括:
4.根据权利要求3所述的网络资源管理方法,其特征在于,所述根据第一终端和第二终端统计的资源访问量计算实际资源访问量包括:
5.根据权利要求1所述的网络资源管理方法,其特征在于,所述第一终端延迟预设时长发送周期性预警请求之后还包括:
6.根据权利要求1所述的网络资源管理方法,其特征在于,所述根据第一终端属性、访问模型类型以及超出阈值,设置多级预警方式包括:
7.根据权利要求6所述的网络资源管理方法,其特征在于,所述超出阈值包括第一阈值、第二阈值、第三阈值:
8.一种网络资源管理装置,其特征在于,包括:
9.一种电子设备,包括:处理器;存储程序的存储器;其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据权利要求1-7中任一项所述的方法。
10.一种存
...【技术特征摘要】
1.一种网络资源管理方法,其特征在于,包括:
2.根据权利要求1所述的网络资源管理方法,其特征在于,所述机器学习算法包括:
3.根据权利要求1所述的网络资源管理方法,其特征在于:所述实时调整滑动窗口大小包括:
4.根据权利要求3所述的网络资源管理方法,其特征在于,所述根据第一终端和第二终端统计的资源访问量计算实际资源访问量包括:
5.根据权利要求1所述的网络资源管理方法,其特征在于,所述第一终端延迟预设时长发送周期性预警请求之后还包括:
6.根据权利要求1所述的网络资源管理方法,其特征在于,所述根据第一终端属性、访问模型类...
【专利技术属性】
技术研发人员:张帅,高洋,刘冬辉,黄习瑞,
申请(专利权)人:本溪钢铁集团信息自动化有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。