【技术实现步骤摘要】
机器学习处理器及使用处理器执行向量范数指令的方法
本专利技术涉及通信
,具体涉及一种机器学习处理器及使用处理器执行向量范数指令的方法。
技术介绍
现代的通用和专用处理器中,越来越多地引入计算指令(例如向量指令)进行运算。现有处理器在进行计算指令的运算时,开销大,能耗高。
技术实现思路
本专利技术实施例提供了一种机器学习处理器及使用处理器执行向量范数指令的方法,可减少运算开销,降低的功耗优点。第一方面,本专利技术实施例提供一种机器学习处理器,所述处理器设置于计算装置内,所述计算装置用于执行向量范数指令,执行所述向量范数指令具体包括如下步骤:获取向量范数指令,所述向量范数指令包括:NORM2x,r;NORM2为指令标识;所述x为向量x的首地址,所述r为向量范数结果的存储地址;执行所述向量范数指令得到向量范数指令的具体结果;所述执行所述向量范数指令得到向量范数指令的具体结果具体包括:提取所述向量范数指令向量x,将向量x进行向量规约运算后得到向量范数结果。第二方面,提供一种机器学习处理器执行向量范数指令的方法,所述方法应用于计算装置,所述方法包括如下步骤:获取向量范数指 ...
【技术保护点】
1.一种机器学习处理器,其特征在于,所述处理器设置于计算装置内,所述计算装置用于执行向量范数指令,执行所述向量范数指令具体包括如下步骤:获取向量范数指令,所述向量范数指令包括:NORM2x,r;NORM2为指令标识;所述x为向量x的首地址,所述r为向量范数结果的存储地址;执行所述向量范数指令得到向量范数指令的具体结果;所述执行所述向量范数指令得到向量范数指令的具体结果具体包括:提取所述向量范数指令向量x,将向量x进行向量规约运算后得到向量范数结果。
【技术特征摘要】
1.一种机器学习处理器,其特征在于,所述处理器设置于计算装置内,所述计算装置用于执行向量范数指令,执行所述向量范数指令具体包括如下步骤:获取向量范数指令,所述向量范数指令包括:NORM2x,r;NORM2为指令标识;所述x为向量x的首地址,所述r为向量范数结果的存储地址;执行所述向量范数指令得到向量范数指令的具体结果;所述执行所述向量范数指令得到向量范数指令的具体结果具体包括:提取所述向量范数指令向量x,将向量x进行向量规约运算后得到向量范数结果。2.根据权利要求1所述的机器学习处理器,其特征在于,所述向量范数指令还包括:type,incx,其中,type为进行操作的数据类型,incx为向量x的元素之间的地址间隔;所述提取所述向量范数指令向量x,具体包括:以步长incx提取向量范数向量x。3.根据权利要求1或2所述的机器学习处理器,其特征在于,所述向量范数指令还包括n,所述n为向量长度;所述提取所述向量范数指令向量x具体包括:提取向量长度为n的向量x。4.根据权利要求2所述的机器学习处理器,其特征在于,所述操作的数据类型为实数或复数。5.根据权利要求1所述的机器学习处理器,其特征在于,所述计算装置还包括:存储器,所述存储器用于存储向量、标量。6.根据权利要求5所述的处理器,其特征在于,所述计算装置还包括:存储器,所述存储器为高速暂存存储器。7.根据权利要求2所述机器学习处理器,其特征在于,所述处理器,具体用于将所述向量范数结果存入到所述存储器的所述r对应的存储地址。8.根据权利要求5或6所述的机器学习处理器,其特征在于,所述处理器,用于向所述存储器发送读取向量x的读取命令以批量读取方式获取对应的向量x。9.一种机器学习处理器执行向量范数指令的方法,其特征在于,所述方法应用于计算装置,所述方法包括如下步骤:获取向量范数指令,所述向量范数指令包括:NORM2x,r;NORM2为指令标识;所述x为向量x的首地址,所述r为向量范数结果的存储地址;执行所述向量范数指令得到向...
【专利技术属性】
技术研发人员:陈天石,刘少礼,王在,胡帅,
申请(专利权)人:上海寒武纪信息科技有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。