服务配置方法、用于服务配置的客户端、设备及电子设备技术

技术编号:24353828 阅读:18 留言:0更新日期:2020-06-03 02:08
公开了一种服务配置方法、客户端、设备及电子设备。该方法包括:解析用于人工智能服务的人工智能模型,以获取所述人工智能模型的模型参数信息;基于所述人工智能模型的模型参数信息,计算所述人工智能服务的推荐计算资源配置;以及基于所述推荐计算资源配置,确定所述人工智能服务的服务配置。

Service configuration method, client, device and electronic device for service configuration

【技术实现步骤摘要】
服务配置方法、用于服务配置的客户端、设备及电子设备
本公开涉及人工智能服务领域,更具体地涉及一种服务配置方法、客户端、设备及电子设备。
技术介绍
人工智能模型在完成训练之后将被部署到生产环境中以向企业和个人提供相应的人工智能服务。目前,人工智能服务的部署需要工程人员或运维人员根据经验或者反复试错来寻找部署推理服务需要的服务器配置。这使得部署人工智能服务的运维成本过大,不利于人工智能服务的迅速上线。
技术实现思路
本公开的实施例提供了服务配置方法、客户端、设备及电子设备。本公开的实施例提供了一种服务配置方法,包括:解析所述人工智能服务的人工智能模型,以获取所述人工智能模型的模型参数信息;基于所述人工智能模型的模型参数信息,计算所述人工智能服务的推荐计算资源配置;以及基于所述推荐计算资源配置,确定所述人工智能服务的服务配置。本公开的实施例提供了一种用于服务配置的客户端,包括:处理器,存储器,存储有计算机指令,所述计算机指令被处理器执行时实现如下操作:产生人工智能模型获取框,用于输入所述人工智能服务的人工智能模型的本文档来自技高网...

【技术保护点】
1.一种服务配置方法,包括:/n解析用于人工智能服务的人工智能模型,以获取所述人工智能模型的模型参数信息;/n基于所述人工智能模型的模型参数信息,计算所述人工智能服务的推荐计算资源配置;以及/n基于所述推荐计算资源配置,确定所述人工智能服务的服务配置。/n

【技术特征摘要】
1.一种服务配置方法,包括:
解析用于人工智能服务的人工智能模型,以获取所述人工智能模型的模型参数信息;
基于所述人工智能模型的模型参数信息,计算所述人工智能服务的推荐计算资源配置;以及
基于所述推荐计算资源配置,确定所述人工智能服务的服务配置。


2.如权利要求1所述的服务配置方法,其中,模型参数信息包括以下至少一项:模型类型信息、模型结构信息、以及结构参数信息。


3.如权利要求1所述的服务配置方法,其中,所述基于人工智能模型的模型参数信息计算人工智能服务的推荐计算资源配置还包括:
基于所述人工智能模型的模型参数信息,计算执行所述人工智能模型所需的计算量和内存访问量,
基于所述计算量和内存访问量计算所述人工智能服务所需的处理配置参数作为所述推荐计算资源配置。


4.如权利要求1所述的服务配置方法,还包括:
获取计算资源配置调整信息;
基于所述计算资源配置调整信息,调整所述推荐计算资源配置;
基于调整后的推荐计算资源配置,确定所述人工智能服务的服务配置。


5.如权利要求4所述的服务配置方法,其中,所述计算资源配置调整信息包括所述人工智能服务的运行情况。


6.如权利要求2所述的服务配置方法,其中,
所述模型结构信息包括以下各项中的一项或多项:所述人工智能模型的隐藏层层数、输入层的神经元数量、输出层的神经元数量、一个或多个隐藏层中的神经元数量、多个神经元之间的连接关系、卷积层的通道数;以及
所述结构参数信息包括以下各项中的一项或多项:多个神经元之间的连接关系与权重、神经元的偏置值、激活函数、卷积层的通道数、卷积核大小。


7.如权利要求6所述的服务配置方法,其中,
在所述人工智能模型是包含全连接层的神经网络模型的情况下,其中,所述全连接层所需的计算量为所述全连接层的输入参数的数量与输出参数的数量的乘积。


8.一种用于服务配置的客户端,包括:
处理器,
存储器,存储有计算机指令,所述计算机指令被处理器执行时实现如下操作:
产生人工智能模型获取框,所述人工智能模型获取框用于输入用于人工智能服务的人工智能模型的存储地址或用于上传所述人工智能模型;
产生推荐资...

【专利技术属性】
技术研发人员:王磊张文杰邓攀于洋
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1