任务处理加速方法、装置、设备及介质制造方法及图纸

技术编号:46594842 阅读:0 留言:0更新日期:2025-10-10 21:28
本发明专利技术涉及数据处理技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种任务处理加速方法、装置、设备及介质,包括:从待处理任务队列中提取任务数据属性,并依据该属性进行批次划分与优先级分配;在处理第一任务批次期间,若检测到第二任务批次存在,则中断当前处理并调度其至处理单元执行;对第二任务批次执行自适应优化并调整稀疏化程度以生成中间结果,将其存入优先级缓存池,并在接收新第二任务批次时基于缓存复用生成最终结果。本发明专利技术通过在任务执行中优先处理高优先级任务,结合自适应优化与缓存复用机制,使高优先级任务获得快速响应与高效处理,提升计算资源利用率,降低响应延迟。

【技术实现步骤摘要】

本专利技术涉及数据处理,尤其涉及一种任务处理加速方法、装置、设备及存储介质。


技术介绍

1、在当前大规模语言模型(llm,large language model)推理系统中,计算资源分配效率和处理任务的响应延迟已成为制约系统性能的关键因素。尤其在多任务并行处理场景下,传统注意力机制架构通常需要对整个输入序列进行全局计算,这不仅导致计算冗余,而且在推理过程中伴随着频繁的内存访问请求,极易造成显存瓶颈和吞吐率下降,进而影响整体系统的实时处理能力。

2、在金融科技业务领域,诸如实时风险评估、反欺诈监测、交易指令识别等典型任务中,不同数据处理请求之间常存在响应时限的优先级差异。例如,某些面向高风险账户的交易识别任务需要快速处理以规避潜在损失,而其他批量分析任务则对时效性要求相对较低。然而,现有推理系统大多按照统一资源分配策略进行处理,无法在高优先级任务到达时快速调度资源进行响应,导致关键任务处理延迟,影响系统稳定性与业务准确性。

3、在医疗健康业务领域,例如重症监护系统中的生命体征异常识别、远程诊疗中的关键语义提取等应用场景中,任务往往包本文档来自技高网...

【技术保护点】

1.一种任务处理加速方法,其特征在于,包括以下步骤:

2.如权利要求1所述的任务处理加速方法,其特征在于,获取包含多个数据处理任务的待处理任务队列,并提取每个数据处理任务的数据属性,包括:

3.如权利要求1所述的任务处理加速方法,其特征在于,根据所述数据属性,将所述数据处理任务划分为第一任务批次和第二任务批次,并为所述第二任务批次分配优先级标识,包括:

4.如权利要求1所述的任务处理加速方法,其特征在于,在处理所述第一任务批次的过程中,若检测到存在所述第二任务批次,则中断所述第一任务批次的执行,并调度所述第二任务批次至处理单元进行执行,包括:

<...

【技术特征摘要】

1.一种任务处理加速方法,其特征在于,包括以下步骤:

2.如权利要求1所述的任务处理加速方法,其特征在于,获取包含多个数据处理任务的待处理任务队列,并提取每个数据处理任务的数据属性,包括:

3.如权利要求1所述的任务处理加速方法,其特征在于,根据所述数据属性,将所述数据处理任务划分为第一任务批次和第二任务批次,并为所述第二任务批次分配优先级标识,包括:

4.如权利要求1所述的任务处理加速方法,其特征在于,在处理所述第一任务批次的过程中,若检测到存在所述第二任务批次,则中断所述第一任务批次的执行,并调度所述第二任务批次至处理单元进行执行,包括:

5.如权利要求1所述的任务处理加速方法,其特征在于,对由所述处理单元执行的所述第二任务批次,进行自适应处理优化,并根据所述优先级标识调整所述自适应处理优化过程的稀疏化程度,生成中间处理结果...

【专利技术属性】
技术研发人员:孙奥兰王健宗
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1