资源限制下优化动作识别精度的多模型选择及融合方法技术

技术编号：30052428 阅读：17 留言：0更新日期：2021-09-15 10:55

本发明专利技术公开了一种资源限制下优化动作识别精度的多模型选择及融合方法，属于智能感知和多模态融合领域，包括：步骤1，资源限制参数和单个动作识别模型资源参数的建模；步骤2，训练actor

全部详细技术资料下载

【技术实现步骤摘要】
资源限制下优化动作识别精度的多模型选择及融合方法

[0001]本专利技术涉及智能行为感知领域，尤其涉及一种资源限制下优化动作识别精度的多模型选择及融合方法。

技术介绍

[0002]随着智能感知设备和人工智能识别技术的发展，智能行为感知越来越受到关注。对于多模态感知场景，例如智能家居、病患看护、无人驾驶等场景，融合多种模型的识别结果来提升对这些场景采集多模态感知数据的识别精度，既带来了机会，同时也具有新的挑战。
[0003]现有的智能行为感知方法主要分为以下几种：1)以提升精度为目标的方法；2)以平衡资源消耗与精度的方法。前一种方法聚焦于最终的识别精度，而不考虑资源的开销。后一种方法将资源约束考虑在内，例如考虑设备占用率、能源消耗等因素。
[0004]然而，现有以平衡资源消耗与精度的方法只定性地考虑了能源消耗，而没有考虑更严格定量的资源限制，例如内存占用、计算时间造成的时延等限制。除此之外，现有以平衡资源消耗与精度的方法只涉及了两种模型或两种模态的融合，并未实现多于两种以上模型或模态的融合。

技术实现思路

[0005]针对现有技术所存在的问题，本专利技术的目的是提供一种资源限制下优化动作识别精度的多模型选择及融合方法，能解决现有以平衡资源消耗与精度的智能感知识别方法，没有考虑更严格定量的资源限制，以及仅涉及两种模型或两种模态融合的问题。
[0006]本专利技术的目的是通过以下技术方案实现的：
[0007]本专利技术实施方式提供一种资源限制下优化动作识别精度的多模型选择方法...

【技术保护点】

【技术特征摘要】
1.一种资源限制下优化动作识别精度的多模型选择及融合方法，其特征在于，包括：步骤1，资源限制参数建模和每个动作识别模型的资源参数建模：将根据处理资源确定的资源限制参数建模为总长方形模型，所述资源限制参数的总内存限制参数作为总长方形模型的长，所述资源限制参数的总时延限制参数作为总长方形模型的宽；将动作识别模型库中的每个动作识别模型的资源参数建模为分长方形模型，所述资源参数的内存参数作为分长方形模型的长，所述资源参数的时延参数作为分长方形模型的宽；所述分长方形模型的长与宽分别小于所述总长方形模型的长与宽；步骤2，以actor
‑
critic强化学习模型作为在线选择模型，用时间对齐的多模态感知数据作为输入训练该在线选择模型的actor网络，运行该actor网络从所述动作识别模型库中选择出的模型组合中的各动作识别模型，并融合各动作识别模型的识别结果，得到最终识别结果，通过对比最终识别结果与实际的数据标签判断最终识别结果是否正确；以多模态感知数据和所述actor网络输出的模型组合作为输入训练actor
‑
critic强化学习模型的critic网络，得出当前模型组合的价值；利用所述步骤1的资源限制参数建模和每个动作识别模型的资源参数建模，判断模型组合是否超出资源限制参数；结合最终识别结果是否正确和模型组合是否超出资源限制计算奖励函数，根据奖励函数基于梯度下降法更新actor网络和critic网络的参数；步骤3，在线动作识别：将待识别的多模态感知数据输入到训练好的在线选择模型中，由所述在线选择模型输出模型组合，运行模型组合中的各动作识别模型并融合每个动作识别模型的识别结果，得到最终的识别结果。2.根据权利要求1所述的资源限制下优化动作识别精度的多模型选择及融合方法，其特征在于，所述actor网络的损失函数是critic网络输出的价值的均值...

【专利技术属性】
技术研发人员：张兰，李向阳，刘梦境，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人