一种针对AI云计算资源的计费监管系统技术方案

技术编号:39196467 阅读:14 留言:0更新日期:2023-10-27 08:43
本发明专利技术提供了一种针对AI云计算资源的计费监管系统,涉及计算资源管理领域。本发明专利技术通过构建计费系统来实现针对不同计费规则的计费管理,能实现灵活复杂的混合计费规则;通过测试系统能实现AI云计算仿真测试,根据测试需求灵活生成对应的测试任务并定向植入至对应硬件与软件资源中;通过监管系统能实现对异常计费的感知,通过结合计费任务和测试任务能实现异常计费定位,并在第一时间进行异常计费报警并发送异常计费来源通知技术人员进行排查,从而保证计费系统的平稳运行。从而保证计费系统的平稳运行。从而保证计费系统的平稳运行。

【技术实现步骤摘要】
一种针对AI云计算资源的计费监管系统


[0001]本专利技术涉及计算资源管理领域,尤其涉及一种针对AI云计算资源的计费监管系统。

技术介绍

[0002]云计算(cloud computing)是分布式计算的一种,用于向用户提供针对性服务,并在向用户提供服务时,按照一定的计费规则向用户收取服务费用;常见的计费规则包括用量计费规则、用时计费规则和混合计费规则;其中,用量计费规则按照用户的硬件/软件使用量进行“费随量增”计费;用时计费规则按照用户的硬件/软件使用量进行“费随时增”计费;混合计费规则按照多种计费逻辑实现按需“费随需增”计费。
[0003]AI云计算则是多业务混合场景,会同时涉猎计算、存储、宽带等服务,计费系统复杂多变;现有的做法是仅向用户提供“按时整租”服务,即对固定硬件设施进行计时收费;这种服务方式计费规则简单,但是也限制了AI模型训练的扩展性。为了满足AI模型训练的扩展性需求,越来越多的厂商采用了更加灵活的混合计费规则,以实现“用多少付多少”的效果;并在结算时向用户提供收费明细,以达到公开透明的效果。
[0004]但是,AI云计算会涉及多计费规则和多计费项,混合计费规则复杂度呈几何式增长,很容易出现计费错误/计费不准的情况;为了保障客户利益,获取客户信任;我们需要对计费系统进行有效监管,并及时发现排查计费异常。
[0005]因此,有必要提供一种针对AI云计算资源的计费监管系统来解决上述技术问题。

技术实现思路

[0006]为解决上述技术问题,本专利技术提供的一种针对AI云计算资源的计费监管系统,包括计费系统、测试系统和监管系统;其中,所述计费系统包括计费规则库、计费感知单元、计费生成单元和计费管理单元;所述计费感知单元分别部署在AI云计算系统的各硬件资源与软件资源上,并用于采集各硬件与软件的资源使用情况;所述计费规则库用于存储计费所需的计费规则算子并供以调用;所述计费生成单元用于根据各硬件与软件的资源使用情况,选择对应计费规则算子并计算出对应支付费用;所述计费管理单元用于对计费任务进行跟踪管理,并汇总计费任务对应各支付费用,得到计费任务的总支付费用;所述测试系统包括测试任务用例库、测试任务生成单元、测试任务植入单元和测试任务管理单元;其中,所述测试任务用例库用于存储进行AI云计算仿真测试所需的测试任务和用例描述;所述测试任务生成单元根据设置的测试类型调用对应的测试任务,并根据用例描述设置测试任务参数,得到实际测试任务;所述测试任务植入单元用于将实际测试任务注入至对应硬件与软件资源中;所述测试任务管理单元用于对测试任务的执行状况进行跟踪管理,并汇总测试任务执行时所产生的各支付费用,得到测试任务的总支付费用;所述监管系统包括异常计费感知单元、异常计费定位单元和异常计费报警单元;
其中,所述异常计费感知单元通过对测试任务和计费任务的总支付费用进行分析对比,判断是否发生异常计费;所述异常计费定位单元用于在发生异常计费时,对异常计费来源进行识别定位;所述异常计费报警单元用于在发生异常计费时,进行异常计费报警并发送异常计费来源通知技术人员进行排查。
[0007]作为更进一步的解决方案,所述计费规则库包括按量计费规则、按次计费规则和按时计费规则对应的计费规则算子;所述计费感知单元包括计时器、计量器和计次器,并分别部署在各硬件资源与软件资源的计费节点上;其中,所述硬件与软件的资源使用情况包括使用次数、使用时间和使用用量;所述硬件资源包括GPU卡、CPU芯片、RAM内存、存储硬盘和网卡设备;所述软件资源包括授权软件和API接口。
[0008]作为更进一步的解决方案,所述计费生成单元根据预设的计费规则算子对各计费节点的资源使用情况进行费用计算,得到对应支付费用;其中,包括硬件资源支付费用和软件资源支付费用;所述计费管理单元将各计费任务与用户进行绑定与跟踪,汇总计费任务对应产生的硬件资源支付费用和软件资源支付费用,得到该用户使用AI云计算资源所需支付的总支付费用。
[0009]作为更进一步的解决方案,所述AI云计算仿真测试所需的测试任务包括CPU计算测试任务、GPU计算测试任务、硬盘存储测试任务、内存存储测试任务、宽带占用测试任务、API访问测试任务和软件调用测试任务;所述测试任务参数包括任务用量参数、触发时间参数和执行次数参数;其中,所述任务用量参数包括CPU计算用量、GPU计算用量、硬盘存储用量、内存存储用量、宽带占用用量、API访问用量和软件调用用量。
[0010]作为更进一步的解决方案,所述测试任务管理单元根据设置的测试类型和测试模式,调用对应测试任务生成单元和测试任务植入单元完成测试任务的生成和部署;所述测试类型包括独立测试和伴随测试;其中,当设置为独立测试时:则在未执行计费任务时通过测试任务植入单元将测试任务注入至对应硬件资源与软件资源上;当设置为伴随测试时:则在执行计费任务的同时通过测试任务植入单元将测试任务注入至对应硬件资源与软件资源,并伴随计费任务一同执行;所述测试模式包括整体测试和局部测试;其中,当设置为整体测试时:则通过测试任务生成单元对AI云计算仿真测试所需的所有测试任务均对应生成至少一次;当设置为局部测试时:则通过测试任务生成单元对AI云计算仿真测试所需的各测试任务选择一个或多个进行生成。
[0011]作为更进一步的解决方案,所述异常计费感知单元判断AI云计算系统中是否存在测试任务,若存在测试任务则获取测试任务的测试类型、测试模式和测试任务参数,并根据测试模式触发对应步骤;其中,当测试模式为独立测试时:按照测试类型获取注入至局部/整体的所有测试任务,通过计费感知单元采集测试任务对应产生硬件与软件的资源使用情况,并与测试任务参数进行对比;若资源使用情况和测试任务参数匹配则进行下一步,否则判断为发生异常计费;在计费规则库中选取待测试的计费规则算子,测试任务管理单元将测试任务参数输入至计费规则算子中计算测试支付费用;将测试支付费用和对应的标准支付费用进行对比;若两者不匹配,则判断为发生异常计费;其中,测试任务为基准测试任务且预先测定基准测试任务对应的标准支付费;当测试模式为伴随测试时:获取与测试任务同时执行的计费任务,并在计费规则
库中查询计费任务所使用的计费规则算子;按照测试类型获取注入至局部/整体的所有测试任务,通过计费感知单元采集测试任务对应产生硬件与软件的资源使用情况;测试任务管理单元通过计费生成单元采集测试任务执行时所产生的测试支付费用;测试任务管理单元将测试任务参数输入至计费规则算子中计算标准支付费用;若测试支付费用和标准支付费用不匹配时,则判断为发生异常计费;其中,测试任务所设定的测试任务参数与计费任务对应的资源使用情况呈预设比例系数。
[0012]作为更进一步的解决方案,所述异常计费定位单元通过如下步骤定位异常计费:获取发生异常计费时的测试模式;当发生异常计费时的测试模式为独立测试时,则进行独立测试定位;当发生异常计费时的测试模式为伴随测试时,则先触发执行独立测试;且有:当独立测试定位发现异常计费,则进行独立测试定位并等待异常计本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种针对AI云计算资源的计费监管系统,其特征在于,包括计费系统、测试系统和监管系统;其中,所述计费系统包括计费规则库、计费感知单元、计费生成单元和计费管理单元;所述计费感知单元分别部署在AI云计算系统的各硬件资源与软件资源上,并用于采集各硬件与软件的资源使用情况;所述计费规则库用于存储计费所需的计费规则算子并供以调用;所述计费生成单元用于根据各硬件与软件的资源使用情况,选择对应计费规则算子并计算出对应支付费用;所述计费管理单元用于对计费任务进行跟踪管理,并汇总计费任务对应各支付费用,得到计费任务的总支付费用;所述测试系统包括测试任务用例库、测试任务生成单元、测试任务植入单元和测试任务管理单元;其中,所述测试任务用例库用于存储进行AI云计算仿真测试所需的测试任务和用例描述;所述测试任务生成单元根据设置的测试类型调用对应的测试任务,并根据用例描述设置测试任务参数,得到实际测试任务;所述测试任务植入单元用于将实际测试任务注入至对应硬件与软件资源中;所述测试任务管理单元用于对测试任务的执行状况进行跟踪管理,并汇总测试任务执行时所产生的各支付费用,得到测试任务的总支付费用;所述监管系统包括异常计费感知单元、异常计费定位单元和异常计费报警单元;其中,所述异常计费感知单元通过对测试任务和计费任务的总支付费用进行分析对比,判断是否发生异常计费;所述异常计费定位单元用于在发生异常计费时,对异常计费来源进行识别定位;所述异常计费报警单元用于在发生异常计费时,进行异常计费报警并发送异常计费来源通知技术人员进行排查。2.根据权利要求1所述的一种针对AI云计算资源的计费监管系统,其特征在于,所述计费规则库包括按量计费规则、按次计费规则和按时计费规则对应的计费规则算子;所述计费感知单元包括计时器、计量器和计次器,并分别部署在各硬件资源与软件资源的计费节点上;其中,所述硬件与软件的资源使用情况包括使用次数、使用时间和使用用量;所述硬件资源包括GPU卡、CPU芯片、RAM内存、存储硬盘和网卡设备;所述软件资源包括授权软件和API接口。3.根据权利要求2所述的一种针对AI云计算资源的计费监管系统,其特征在于,所述计费生成单元根据预设的计费规则算子对各计费节点的资源使用情况进行费用计算,得到对应支付费用;其中,包括硬件资源支付费用和软件资源支付费用;所述计费管理单元将各计费任务与用户进行绑定与跟踪,汇总计费任务对应产生的硬件资源支付费用和软件资源支付费用,得到该用户使用AI云计算资源所需支付的总支付费用。4.根据权利要求3所述的一种针对AI云计算资源的计费监管系统,其特征在于,所述AI云计算仿真测试所需的测试任务包括CPU计算测试任务、GPU计算测试任务、硬盘存储测试任务、内存存储测试任务、宽带占用测试任务、API访问测试任务和软件调用测试任务;所述测试任务参数包括任务用量参数、触发时间参数和执行次数参数;其中,所述任务用量参数包括CPU计算用量、GPU计算用量、硬盘存储用量、内存存储用量、宽带占用用量、API访问用量和软件调用用量。5.根据权利要求4所述的一种针对AI云计算资源的计费监管系统,其特征在于,所述测试任务管理单元根据设置的测试类型和测试模式,调用对应测试任务生成单元和测试任务植入单元完成测试任务的生成和部署;所述测试类型包括独立测试和伴随测试;其中...

【专利技术属性】
技术研发人员:吕超星丁鹏吴清忠
申请(专利权)人:北京万界数据科技有限责任公司武汉分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1