【技术实现步骤摘要】
【国外来华专利技术】在web浏览器环境中处理机器学习模型的方法和装置
[0001]本公开概括而言涉及机器学习,更具体而言,涉及在web浏览器环境中处理机器学习模型的方法和装置。
技术介绍
[0002]在计算行业中,有一种趋势是将机器学习(machine learning,ML)工作负载,尤其是深度学习(deep learning,DL)模型,部署到终端用户边缘设备,而不是服务器设备。最近,机器学习工作负载已在(一个或多个)web浏览器环境中被提供给终端用户边缘设备。有时,DL计算是通过将计算负载从中央处理单元(central processing unit,CPU)转移到图形处理单元(graphics processing unit,GPU)或其他电路而在边缘设备处完成的。
附图说明
[0003]图1图示了在web浏览器环境中执行机器学习任务的示例体系结构。
[0004]图2是执行操作来访问张量数据的示例WebNN实现方式的时间线。
[0005]图3图示了包括动态执行路径的示例动态计算图。
[0006]图4图示了示例延迟执行策略。
[0007]图5是表示图1的WebNN控制器的示例实现方式的框图。
[0008]图6是代表可被执行来实现图5的示例图执行器的示例机器可读指令的流程图。
[0009]图7是代表可被执行来实现图5的示例张量管理器的示例机器可读指令的流程图。
[0010]图8是代表可被执行来提供凝聚图(condensed graph)的推测性执行的示例机器可读 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种在web浏览器中处理机器学习模型的装置,该装置包括:图构建器,用于在机器学习操作要被利用延迟执行模式来执行时将所述机器学习操作累积为图;张量管理器,用于响应于对访问与所述机器学习操作相关联的尚不可用的张量的请求,基于所述张量来识别所述图;图缓存管理器,用于确定与所识别的图相对应的凝聚图是否可用;图凝聚器,用于响应于所述图缓存管理器确定所述凝聚图不可用,生成所述凝聚图;以及图执行器,用于执行所述凝聚图以创建所述张量,所述张量管理器用于提供所述张量作为对于对访问所述张量的所述请求的响应。2.如权利要求1所述的装置,其中,所述图执行器用于响应于所述图缓存管理器确定所述凝聚图可用,取得所述凝聚图。3.如权利要求1所述的装置,其中,所述图缓存管理器用于基于所识别的图的散列来执行查找以确定所述凝聚图是否可用。4.如权利要求1所述的装置,其中,所述图执行器用于响应于确定所述机器学习操作要被利用直接执行模式来执行,执行所述机器学习操作。5.如权利要求1所述的装置,其中,所述张量管理器用于初始化与所述张量相关联的计数器,并且响应于提供所述张量作为所述响应,递减与所述张量相关联的所述计数器。6.如权利要求5所述的装置,其中,所述张量管理器用于响应于对释放所述张量的请求,递减与所述张量相关联的所述计数器。7.如权利要求5所述的装置,其中,所述张量管理器用于响应于执行所述凝聚图创建所述张量,递增与所述张量相关联的所述计数器。8.至少一个非暂态计算机可读介质,包括指令,所述指令当被执行时,使得至少一个处理器至少:在机器学习操作要被利用延迟执行模式来执行时将所述机器学习操作累积为图;响应于对访问与所述机器学习操作相关联的尚不可用的张量的请求,基于所述张量来识别所述图;确定与所识别的图相对应的凝聚图是否可用;响应于确定所述凝聚图不可用,生成所述凝聚图;执行所述凝聚图以创建所述张量;并且提供所述张量作为对于对访问所述张量的所述请求的响应。9.如权利要求8所述的至少一个计算机可读介质,其中所述指令当被执行时,使得所述至少一个处理器响应于确定所述凝聚图可用,取得所述凝聚图。10.如权利要求8所述的至少一个计算机可读介质,其中所述指令当被执行时,使得所述至少一个处理器基于所识别的图的散列来执行查找以确定所述凝聚图是否可用。11.如权利要求8所述的至少一个计算机可读介质,其中所述指令当被执行时,使得所述至少一个处理器响应于确定所述机器学习操作要被利用直接执行模式来执行,执行所述机器学习操作。12.如权利要求8所述的至少一个计算机可读介质,其中所述指令当被执行时,使得所
述至少一个处理器:初始化与所述张量相关联的计数器;并且响应于提供所述张量作为所述响应,递减与所述张量相关联的所述计数器。13.如权利要求12所述的至少一个计算机可读介质,其中所述指令当被执行时,使得所述至少一个处理器响应于对释放所述张量的请求,递减与所述张量相关联的所述计数器。14.如权利要求12所述的...
【专利技术属性】
技术研发人员:李剑慧,胡宁馨,李弋强,伍勇,罗元轲,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。