【技术实现步骤摘要】
绘图协议下的人工智能模型业务处理方法、装置及设备
[0001]本说明书涉及机器学习
,尤其涉及一种绘图协议下的人工智能模型业务处理方法、装置及设备。
技术介绍
[0002]人工智能是计算机科学的一个分支,用来生产出一种能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像处理、图像绘制、自然语言处理、图像绘制和专家系统等。人工智能模型即为经过训练得出的成熟模型。
[0003]人工智能模型进行业务处理时,为了追求较好的性能,对于带宽资源的需求很大,相应对于设备的要求也较高。基于此,需要性能和适用性更好的人工智能业务处理方案。
技术实现思路
[0004]本说明书一个或多个实施例提供了一种绘图协议下的人工智能模型业务处理方法、装置及设备,用于解决如下技术问题:需要性能和适用性更好的人工智能业务处理方案。
[0005]本说明书一个或多个实施例采用下述技术方案:
[0006]本说明书一个或多个实施例提供一种绘图协议下的人工智能模型业务处理方法,包括:
[0 ...
【技术保护点】
【技术特征摘要】
1.一种绘图协议下的人工智能模型业务处理方法,包括:获取以第一数位浮点数表示的暂存数据,所述暂存数据是预先在指定的绘图协议下,对人工智能模型提供的多个以第一数位浮点数表示的模型数据进行融合处理得到的,所述融合处理包括第一数位浮点数向位数更小的第二数位浮点数的转换过程;将所述暂存数据转换为多个以第二数位浮点数表示的模型数据;对所述以第二数位浮点数表示的模型数据进行上采样处理,得到多个以第一数位浮点数表示的还原数据;通过在所述指定的绘图协议下利用所述还原数据进行计算,执行所述人工智能模型的推理过程。2.根据权利要求1所述的方法,所述融合处理,具体包括:对所述多个以第一数位浮点数表示的模型数据进行降采样处理,以使所述第一数位浮点数对应转换第二数位浮点数;将所述降采样处理后得到的多个第二数位浮点数合并为一个以第一数位浮点数表示的模型数据,作为所述暂存数据。3.根据权利要求2所述的方法,所述将所述降采样处理后得到的多个第二数位浮点数合并为一个以第一数位浮点数表示的模型数据,作为所述暂存数据,具体包括:将所述降采样处理后得到的多个第二数位浮点数打包为一个以关键操作支持的指定数据类型表示的模型数据,作为第一中转数据,所述关键操作是根据指定的浮点数位转换算法确定的,所述关键操作不支持浮点数据类型;利用所述预定浮点数位转换算法,通过针对所述第一中转数据执行所述关键操作,得到以第一数位浮点数表示的模型数据,作为所述暂存数据。4.根据权利要求3所述的方法,所述将所述暂存数据转换为多个以第二数位浮点数表示的模型数据,具体包括:将所述暂存数据转化为以关键操作支持的指定数据类型表示的模型数据,作为第二中转数据;将所述第二中转数据拆分为多个以第二数位浮点数表示的模型数据。5.根据权利要求3所述的方法,所述将所述降采样处理后得到的多个第二数位浮点数打包为一个以关键操作支持的指定数据类型表示的模型数据,具体包括:根据所述降采样处理后得到的多个第二数位浮点数的阶码和尾数,对所述多个第二数位浮点数进行拼接处理,得到一个以关键操作支持的指定数据类型表示的模型数据。6.根据权利要求1所述的方法,所述通过在所述指定的绘图协议下利用所述还原数据进行计算,执行所述人工智能模型的推理过程,具体包括:根据所述还原数据,对应地确定所述人工智能模型的推理过程所需执行的矩阵运算;根据所述指定的绘图协议,为所述还原数据生成中间图像,并通过对所述中间图像进行图像处理,执行所述矩阵运算以完成所述推理过程。7.根据权利要求3或4所述的方法,所述关键操作包括位运算。8.根据权利要求3或4所述的方法,所述第一数位为32位,所述第二数位为16位,所述指定数据类型为32位的整型。9.根据权利要求1~6任一项所述的方法,所述指定的绘图协议为webGL;
所述多个以第一数位浮点数表示的模型数据是通过webGL提供的接口上传至GPU,以便在所述GPU中进行所述融合处理。10.根据权利要求1~6任一项所述的方法,应用于端智能引擎,所述端智能引擎用于在用户终端上执行所述人工智能模型。11.一种绘图协议下的人工智能模型业务处理装置,包括:数据获取单元,获取以第一数位浮点数表示的暂存数据,所述暂存数据是预先在指定的绘图协议下,对人工智能模型提供的多个以第一数位浮点数表示的模型数据进行融合处理得到的,所述融合处理包括第一数位浮点数向位数更小的第二数位浮点数的转换过程;数据转换单元,将所述暂存数据转换为多个以第二数位浮点数表示的模型数据;数据还原单元,对所述以第二数位浮点数表示...
【专利技术属性】
技术研发人员:蔡耀华,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。