一种面向沐曦曦云C500的归约类核函数优化方法技术

技术编号:43351716 阅读:31 留言:0更新日期:2024-11-19 17:39
本发明专利技术涉及计算机技术领域,具体提供一种面向沐曦曦云C500的归约类核函数优化方法,包括:获取待执行规约主体的数据长度N,并选择数据长度N大于预设值的规约主体执行以下步骤;将核函数中线程数设为1024;计算每个线程需要处理的数据个数NUM;根据NUM确定每个线程的处理次数W、向量长度X、并行处理向量个数Z及最后一次并行处理向量个数Z’;然后设置核函数启动参数,对每个线程中的向量内、向量间、每个线程的处理次数、所有线程的数据依次进行规约操作。通过上述技术方案,对于输入的数据量较大的规约主体,在一个block中的1024个线程内根据规约主体的数据长度,实现配置参数的优化,提高核函数开发效率。

【技术实现步骤摘要】

本专利技术涉及计算机,具体提供一种面向沐曦曦云c500的归约类核函数优化方法。


技术介绍

1、mxmaca是由沐曦推出的一种采用通用并行计算架构解决复杂计算问题的运算平台。它包含了自研指令集架构(isa)以及gpu内部的并行计算引擎,集成了通用计算和机器学习框架,为各个应用领域的专家们提供了高灵活性和高性能的开放式运算平台。

2、该运算平台提供了一种简单易用的类c编程语言,供用户为mxmaca架构编写程序,使其在metax gpu处理器上以超高效率运行。该编程语言语法简单灵活,易读易写,并且表达能力出众;同时能够兼容主流的c/c++异构计算语言,使得用户获得便捷的软件适配与高效的客户算子开发。

3、核函数作为深度学习算法中的关键组件,需要满足特定的数学条件以确保算法的有效性。基于mxmaca架构上的核函数的编写是一个具有挑战性的任务,需要考虑到对称性、半正定性、参数选择、计算复杂性、泛化能力和可解释性等多个方面,才能充分发挥mxmaca运算平台的硬件并行加速性能。

4、当前核函数编写与优化方法全部适用于英伟达cuda生态本文档来自技高网...

【技术保护点】

1.一种面向沐曦曦云C500的归约类核函数优化方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种面向沐曦曦云C500的归约类核函数优化方法,其特征在于,所述步骤S4包括步骤:

3.根据权利要求1所述的一种面向沐曦曦云C500的归约类核函数优化方法,其特征在于,所述步骤S5包括步骤:

4.根据权利要求3所述的一种面向沐曦曦云C500的归约类核函数优化方法,其特征在于,对每个线程中每次处理的向量内和向量间的数据并行进行归约操作包括:

【技术特征摘要】

1.一种面向沐曦曦云c500的归约类核函数优化方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种面向沐曦曦云c500的归约类核函数优化方法,其特征在于,所述步骤s4包括步骤:

3.根据权利要求1所述的一种...

【专利技术属性】
技术研发人员:韩福海苏文星付龙宋晔刘丽欣所光齐璇
申请(专利权)人:麒麟软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1