一种人工智能应用的部署方法及相关装置制造方法及图纸

技术编号:23889837 阅读:23 留言:0更新日期:2020-04-22 06:00
本申请公开了一种人工智能应用的部署方法,包括:根据待部署硬件环境的硬件信息对应的算力信息和数据带宽信息进行计算强度计算,得到硬件计算强度值;根据获取到的待部署人工智能应用的计算量和访存量进行计算强度计算,得到应用计算强度值;根据所述硬件计算强度值和所述应用计算强度值之间的比较关系执行性能调整操作,以便完成所述待部署人工智能应用的部署操作。通过计算得到硬件计算强度值和应用计算强度值,经过相互比较的结果执行性能调整操作,以便完成部署操作,更加符合人工智能应用的特点。本申请还公开了一种人工智能应用的部署装置、服务器以及计算机可读存储介质,具有以上有益效果。

An artificial intelligence application deployment method and related devices

【技术实现步骤摘要】
一种人工智能应用的部署方法及相关装置
本申请涉及人工智能应用
,特别涉及一种人工智能应用的部署方法、部署装置、服务器以及计算机可读存储介质。
技术介绍
AI(ArtificialIntelligence人工智能)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,未来人工智能带来的科技产品,将会是人类智慧的“容器”。目前,AI应用常被部署在图像分类、语音识别、自然语言处理等领域中,并且实际操作表现出色。同时,AI技术在安防、金融、交通等场景中已经落地并且应用非常广泛。随着AI应用的不断深入推广,在应用AI应用时需要将AI应用快速和高效的进行部署。现有技术中,在AI应用部署过程中,一般是根据以往普通应用的部署经验进行部署。例如,直接采用硬件环境中针对普通应用的默认性能配置对AI应用进行部署。但是,从部署的方法来看,由于普通应用的部署方法通常只采用正常硬件对该普通应用进行部署。并且,普通应用对硬件资源的占用量以及消耗量与AI应用并不相同。可见,采用普通应用的部署方式对AI应用进行部署,会导致AI应用在运行过程出现效率不高,性能利用率较低等问题,造成硬件资源的浪费。因此,如何更加符合AI应用的特点对AI应用进行部署,是本领域技术人员关注的重点问题。
技术实现思路
本申请的目的是提供一种人工智能应用的部署方法、部署装置、服务器以及计算机可读存储介质,通过计算得到硬件计算强度值和应用计算强度值,经过相互比较的结果执行性能调整操作,以便完成部署操作,更加符合人工智能应用的特点。为解决上述技术问题,本申请提供一种人工智能应用的部署方法,包括:根据待部署硬件环境的硬件信息对应的算力信息和数据带宽信息进行计算强度计算,得到硬件计算强度值;根据获取到的待部署人工智能应用的计算量和访存量进行计算强度计算,得到应用计算强度值;根据所述硬件计算强度值和所述应用计算强度值之间的比较关系执行性能调整操作,以便完成所述待部署人工智能应用的部署操作。可选的,根据待部署硬件环境的硬件信息对应的算力信息和数据带宽信息进行计算强度计算,得到硬件计算强度值,包括:获取所述待部署硬件环境的硬件信息;根据所述硬件信息获取到对应的所述算力信息和所述数据带宽信息;计算所述算力信息和所述数据带宽信息的比值,得到所述硬件计算强度值。可选的,根据获取到的待部署人工智能应用的计算量和访存量进行计算强度计算,得到应用计算强度值,包括:通过预设路径运行所述待部署人工智能应用,提取所述待部署人工智能应用的所述计算量和所述访存量;将所述计算量和所述访存量之间进行比值计算,得到所述应用计算强度值。可选的,根据所述硬件计算强度值和所述应用计算强度值之间的比较关系执行性能调整操作,以便完成所述待部署人工智能应用的部署操作,包括:当所述硬件计算强度值大于所述应用计算强度值时,将所述待部署人工智能应用的批处理数据的数量设置为所述待部署硬件环境的最大处理数量;当所述硬件计算强度值小于所述应用计算强度值时,将所述待部署硬件环境的CPU工作模式设置为性能模式;同时调整设置GPU频率为最高频率。当所述硬件计算强度值等于所述应用计算强度值时,发送计算强度匹配成功消息。可选的,还包括:进行日志记录,得到优化日志信息。本申请还提供一种人工智能应用的部署装置,包括:硬件计算强度获取模块,用于根据待部署硬件环境的硬件信息对应的算力信息和数据带宽信息进行计算强度计算,得到硬件计算强度值;应用计算强度获取模块,用于根据获取到的待部署人工智能应用的计算量和访存量进行计算强度计算,得到应用计算强度值;性能调整部署模块,用于根据所述硬件计算强度值和所述应用计算强度值之间的比较关系执行性能调整操作,以便完成所述待部署人工智能应用的部署操作。可选的,所述硬件计算强度获取模块,包括:硬件信息获取单元,用于获取所述待部署硬件环境的硬件信息;算力信息获取单元,用于根据所述硬件信息获取到对应的所述算力信息和所述数据带宽信息;计算强度获取单元,用于计算所述算力信息和所述数据带宽信息的比值,得到所述硬件计算强度值。可选的,所述应用计算强度获取模块,包括:应用算量获取单元,用于通过预设路径运行所述待部署人工智能应用,提取所述待部署人工智能应用的所述计算量和所述访存量;应用计算强度获取单元,用于将所述计算量和所述访存量之间进行比值计算,得到所述应用计算强度值。本申请还提供一种服务器,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如上所述的部署方法的步骤。本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的部署方法的步骤。本申请所提供的一种人工智能应用的部署方法,包括:根据待部署硬件环境的硬件信息对应的算力信息和数据带宽信息进行计算强度计算,得到硬件计算强度值;根据获取到的待部署人工智能应用的计算量和访存量进行计算强度计算,得到应用计算强度值;根据所述硬件计算强度值和所述应用计算强度值之间的比较关系执行性能调整操作,以便完成所述待部署人工智能应用的部署操作。通过先获取到硬件环境中的硬件计算强度值,也获取到待部署人工智能应用的应用计算强度值,最后通过硬件计算强度值和该应用计算强度值之间的比较关系,也就是该待部署人工智能应用使用的计算强度超额,或者无法使用全部的硬件计算强度,即根据不同的比较关系情况执行性能调整操作,对硬件环境或者人工智能应用进行性能调整后完成待部署人工智能应用的部署操作,而不是采用普通应用的部署方式对人工智能应用进行部署,使得硬件环境更加符合人工智能应用执行情况,提高人工智能应用执行时的效率以及性能利用率,实现贴合AI应用的特点对AI应用进行部署。本申请还提供一种人工智能应用的部署装置、服务器以及计算机可读存储介质,具有以上有益效果,在此不做赘述。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本申请实施例所提供的一种人工智能应用的部署方法的流程图;图2为本申请实施例所提供的一种人工智能应用的部署装置的结构示意图。具体实施方式本申请的核心是提供一种人工智能应用的部署方法、部署装置、服务器以及计算机可读存储介质,通过计算得到硬件本文档来自技高网
...

【技术保护点】
1.一种人工智能应用的部署方法,其特征在于,包括:/n根据待部署硬件环境的硬件信息对应的算力信息和数据带宽信息进行计算强度计算,得到硬件计算强度值;/n根据获取到的待部署人工智能应用的计算量和访存量进行计算强度计算,得到应用计算强度值;/n根据所述硬件计算强度值和所述应用计算强度值之间的比较关系执行性能调整操作,以便完成所述待部署人工智能应用的部署操作。/n

【技术特征摘要】
1.一种人工智能应用的部署方法,其特征在于,包括:
根据待部署硬件环境的硬件信息对应的算力信息和数据带宽信息进行计算强度计算,得到硬件计算强度值;
根据获取到的待部署人工智能应用的计算量和访存量进行计算强度计算,得到应用计算强度值;
根据所述硬件计算强度值和所述应用计算强度值之间的比较关系执行性能调整操作,以便完成所述待部署人工智能应用的部署操作。


2.根据权利要求1所述的部署方法,其特征在于,根据待部署硬件环境的硬件信息对应的算力信息和数据带宽信息进行计算强度计算,得到硬件计算强度值,包括:
获取所述待部署硬件环境的硬件信息;
根据所述硬件信息获取到对应的所述算力信息和所述数据带宽信息;
计算所述算力信息和所述数据带宽信息的比值,得到所述硬件计算强度值。


3.根据权利要求1所述的部署方法,其特征在于,根据获取到的待部署人工智能应用的计算量和访存量进行计算强度计算,得到应用计算强度值,包括:
通过预设路径运行所述待部署人工智能应用,提取所述待部署人工智能应用的所述计算量和所述访存量;
将所述计算量和所述访存量之间进行比值计算,得到所述应用计算强度值。


4.根据权利要求1所述的部署方法,其特征在于,根据所述硬件计算强度值和所述应用计算强度值之间的比较关系执行性能调整操作,以便完成所述待部署人工智能应用的部署操作,包括:
当所述硬件计算强度值大于所述应用计算强度值时,将所述待部署人工智能应用的批处理数据的数量设置为所述待部署硬件环境的最大处理数量;
当所述硬件计算强度值小于所述应用计算强度值时,将所述待部署硬件环境的CPU工作模式设置为性能模式;同时调整设置GPU频率为最高频率;
当所述硬件计算强度值等于所述应用计算强度值时,发送计算强度匹配成功消息。
<...

【专利技术属性】
技术研发人员:林建伟
申请(专利权)人:浪潮北京电子信息产业有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1