当前位置: 首页 > 专利查询>合肥综合性国家科学中心人工智能研究院安徽省人工智能实验室专利>正文

一种基于端到端可学的输入过滤的推理方法技术

技术编号：37415306 阅读：10 留言：0更新日期：2023-04-30 09:39

本发明专利技术公开了一种基于端到端可学的输入过滤的推理方法，包括基于多模态输入建立特征提取网络，并构建任务模型；将多模态多任务的不同数据模式输入相应的特征提取网络，得到相应的向量表示并进行拼接；将得到拼接后的向量表示输入训练好的任务模型进行分类推理，并输出多任务的推理结果。本发明专利技术通过设计鲁棒的多模态特征提取网络，以及统一了跳过过滤与重用过滤的方法并支持多种输入模式和部署。在大型推理系统中，可以支持六种输入模式和多种以移动为中心的部署，实现高适用性、高准确率和高效率。效率。效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于端到端可学的输入过滤的推理方法

[0001]本专利技术涉及机器学习模型
，特别涉及一种基于端到端可学的输入过滤的推理方法。

技术介绍

[0002]对实时传感器数据分析日益增长的需求增加了移动设备的计算能力，并创造了以移动为中心的人工智能(AI)的趋势。模型推理的资源效率对于人工智能应用至关重要，特别是对于资源有限的移动设备和延迟敏感的任务。然而，许多具有先进精确度的AI模型的计算量太大，即使它们被部署到边缘或云服务器无法执行高通量推理。输入滤波是一种很有前途的消除冗余从而降低推理成本的方法。
[0003]对于资源高效推断，一种直接和流行的方法是通过加速和压缩技术消除深度模型本身的冗余，另一种是试图过滤输入数据中的冗余(输入过滤)。我们遵循过滤输入数据冗余的方案。现有输入过滤主要分为跳过(SKIP)和重用(REUSE)两种。跳过方法目的是过滤将带来无用推断结果的输入数据，例如，对于人脸检测器来说没有人脸的图像和对于语音识别器来说没有有效命令的音频。(2)重用方法尝试过滤输入，其结果可以重用之前的推断结果，例如相同动作的运动信号和相同车辆数量的视频帧。尽管之前的工作已经为一系列应用设计了有效的输入过滤器，但两个重要和具有挑战性的问题仍然没有得到回答:
[0004]1.缺少指导输入滤波应用于移动中心推理的理论可过滤分析。并非所有推理工作负载都具有使用输入过滤的优化潜力。对输入滤波来说，描述在何种条件下滤波器必须花费更多的代价才能达到精确是至关重要的。
[0005]2.在以移动为中心的推...

【技术保护点】

【技术特征摘要】
1.一种基于端到端可学的输入过滤的推理方法，其特征在于，具体步骤包括：步骤S1、基于多模态输入建立特征提取网络，并构建任务模型；步骤S2、将多模态多任务的不同数据模式输入相应的特征提取网络，得到相应的向量表示并进行拼接；步骤S3、将得到拼接后的向量表示输入训练好的任务模型进行分类推理，并输出多任务的推理结果。2.根据权利要求1所述一种基于端到端可学的输入过滤的推理方法，其特征在于，所述步骤S1的具体步骤包括：基于多模态输入构建特征提取网络；以及设计开发多模态的特征提取网络的集合，并作为学习特征嵌入的构建块；所述多模态包括文本模态、图像模态、视频模态、映射模态，以及输入模态。3.根据权利要求1所述一种基于端到端可学的输入过滤的...

【专利技术属性】
技术研发人员：张兰，袁牧，
申请(专利权)人：合肥综合性国家科学中心人工智能研究院安徽省人工智能实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人