中国科学院计算技术研究所专利技术

中国科学院计算技术研究所共有4275项专利

  • 本发明提供了一种基于RISC‑V扩展指令的计算装置和方法,该计算装置支持根据扩展的近似计算指令集中的近似计算指令进行混合精度的近似计算,其包括:乱序调度与寄存器读取模块,用于执行指令依赖关系解析及操作数预加载,并将非近似计算指令和近似计...
  • 本申请公开了一种强化学习的泛化能力评估方法,方法包括:针对待评估的强化学习算法,输入预设参数,生成基础组件集合,基于基础组件集合构建对象集合,划分对象集合,形成训练集和测试集;基于训练集和测试集,生成训练任务和测试任务;基于训练任务和测...
  • 本发明提出一种基于SIMT的神经网络处理器及其任务执行方法,包括:通用处理器查询协处理器的状态寄存器,状态寄存器存储协处理器的资源情况;通用处理器根据该资源情况,完成线程块到线程束的拆分,通用处理器将线程束指令转发给协处理器的线程束分配...
  • 本发明公开一种适用于混动及纯电动拖拉机的动力系统,采用该动力系统的混动及纯电动拖拉机,包括:发动机、离合器、发电机、电池、主驱电机和PTO箱;离合器机械连接于发动机及发电机,离合器用于在发动机与发电机动力传输上的接合与分离,使发动机与发...
  • 本明提供了一种面向概念偏移的医学图像泛化分类模型构建方法,该方法用于基于多个医疗用户的医疗图像同时为每个医疗用户构建医疗图像分类模型,所述方法包括:步骤S1、获取每个医疗用户的医疗图像数据集,每个医疗图像数据集包括多个医疗图像,每个医疗...
  • 本发明提供了一种用于扩散模型推理的异构数据流加速装置及加速方法,用于对ResNet‑Transformer网络结构的扩散模型执行推理操作,该加速装置包括多个PE与TPE,PE用于执行ResNet网络对输入数据的卷积运算,TPE用于执行T...
  • 本发明提供了一种密集行人目标检测系统,所述系统包括:数据预处理模块,用于对获取到的待检测图像进行预处理;行人目标检测网络,用于对预处理后的待检测图像进行特征提取以获取多个特征图,并对所有特征图进行特征增强得到多个强化特征图,以及对所有强...
  • 本发明提供了一种多类场景图像的目标检测系统,用于对待检测图像进行目标检测,所述系统包括:场景分类模型,用于对待检测图像进行场景分类以获取场景分类结果;目标检测模型,用于对待检测图像进行目标检测以获取初始检测图像;虚警抑制模块,其被配置为...
  • 本发明提供了一种讲话视频合成方法和系统,该方法包括:将讲话音频输入预训练的音频‑动作编码器,以从讲话音频提取语音特征序列以及根据语音特征序列生成面部的动作序列;将从第一视角拍摄的单张二维人脸图片输入预训练的图片编码器,提取该人脸图片所含...
  • 本发明提供一种移动自组网数据路由方法,包括:S1、各节点周期性广播EC消息,EC消息中包含广播EC消息的节点当前位置、未来预测时刻的位置以及初始路由评估分数;S2、每一个节点每接收到一个来自其他节点广播的EC消息时执行如下步骤:S21、...
  • 本发明提供了一种ThreadX SMP操作系统的移植方法和测试方法,所述移植方法用于将所述操作系统移植到RISC‑V64位处理器上运行,所述移植方法包括:获取RISC‑V64位处理器上需要适配的硬件,作为目标硬件;根据所述目标硬件的情况...
  • 本发明提供一种基于强化学习的对抗混淆流量生成方法,包括:将流量行为识别模型作为环境,在环境下采用强化学习模型基于原始流量数据包进行多次对抗学习,得到最终混淆后的流量数据包,每次包括:以本次流量数据包作为当前状态,首次为原始流量数据包,其...
  • 本发明提出了一种基于前递网络与混合路由的数据流阵列加速器,其用于执行数据流图,其中,加速器包括存储单元、多个计算单元,所述加速器还包括:片上网络,其为采用Mesh网络结构建立的计算单元之间、计算单元与存储单元之间传输数据包的物理链路;所...
  • 本发明提出一种基于时空异常挖掘的人工智能生成视频检测方法和装置,包括:将训练视频输入基于Transformer的编码器,编码器对训练视频进行特征提取后,解码器将得到的视频特征还原,得到还原视频,根据还原视频和训练视频构建损失函数,微调编...
  • 本发明提出一种基于存内计算的基因数据查找表编码方法和装置,包括:将三维查找表数据拆分后依次存入多个SRAM阵列;获取基因数据的长度为L的输入序列,根据输入序列中符号的位置,将输入序列整理为L‑2个三元组(addr1,addr2,sym)...
  • 本发明为一种神经网络算子加速方法、装置和图形处理器,包括以下步骤:识别在图形处理器的计算单元中并行度不足的神经网络算子;对所述并行度不足的神经网络算子进行规约运算划分,得到规约运算子任务;将所述规约运算子任务分配到所述图形处理器的多个计...
  • 本发明提供了一种基于混合精度的端边云多级推理方法,包括:量化感知步骤,实时监控推理任务的当前计算需求和当前资源状态,根据所述当前计算需求和所述当前资源状态选择对应的计算精度,所述精算精度包括低精度、中精度、高精度和/或混合精度;混合精度...
  • 本申请公开了一种端边协同多任务调度方法,方法包括:分别在端设备和边缘服务器上,针对不同的深度神经网络类别,训练端设备和所述边缘服务器的性能预测器;端设备接收深度神经网络任务请求时,利用训练完成的性能预测器,根据基于资源感知的任务划分策略...
  • 本发明提出一种深度学习编译器中的指令级并行调度方法和装置,包括:分解深度学习任务的计算图,根据当前任务分解方案将该计算图上每个计算图节点表示的任务分解为硬件计算指令,得到该计算图的指令集合;根据该计算图上节点间的数据流依赖关系,得到该指...
  • 本申请公开了一种基于多层数据流融合执行模型的计算方法,方法包括:接收多层数据流融合处理执行请求,分析多层数据执行控制流,基于控制流构建多层数据流融合执行模型,多层数据流融合执行模型融合多个层级的子模型,其中,子模型包括:应用层、线程层、...