数据融合方法、装置、设备及存储介质制造方法及图纸

技术编号：38923880 阅读：17 留言：0更新日期：2023-09-25 09:33

本公开提供了一种数据融合方法、装置、设备及存储介质，可以应用于空战决策技术领域。该方法包括：为每个该传感器采集的检测数据赋予初始的权重，得到融合数据，将该数据融合系统作为智能体，该融合数据作为该智能体的动作，该数据融合系统应用的场景作为环境，在该环境下该智能体的观测为状态进行强化学习，以最大化该环境的奖励为学习目标，对该权重进行优化。在时效性和可靠性要求高的环境下，本专利设计的方法能在不需要先验知识的情况下，很好的进行多传感器权值调整和数据融合，协助空战环境中数据的精确性和可靠性。战环境中数据的精确性和可靠性。战环境中数据的精确性和可靠性。

全部详细技术资料下载

【技术实现步骤摘要】
数据融合方法、装置、设备及存储介质

[0001]本公开涉及空战决策领域，尤其涉及一种数据融合方法、装置、设备、介质和程序产品。

技术介绍

[0002]在军事化技术日趋成熟的现代，许多国家开始广泛采用空战的军事策略，特别是应用隐形飞机等人工智能技术，导致空战环境更加复杂。为了在这种环境下检测目标数据，通常采用多传感器去实施。
[0003]但是由于传感器噪声和空战环境等不确定性的影响，多传感器检测到的目标数据可能会产生误差。为了减小误差通常需要获取大量的先验知识，而实际空战是不断变化的，先验知识难以获取。

技术实现思路

[0004]鉴于上述问题，本公开提供了数据融合方法、装置、设备、介质和程序产品，可以解决在空战中干扰环境下的多传感器数据融合中出现的时效性可靠性低，先验知识难以获取的技术问题。
[0005]根据本公开的第一个方面，提供了一种数据融合方法，应用于数据融合系统，所述数据融合系统用于按照权重融合多个传感器采集的检测数据，其中，所述方法包括：
[0006]为每个所述传感器采集的检测数据赋予初始的权重，得到融合数据；
[0007]将所述数据融合系统作为智能体，所述融合数据作为所述智能体的动作，所述数据融合系统应用的场景作为环境，在所述环境下所述智能体的观测为状态进行强化学习；
[0008]以最大化所述环境的奖励为学习目标，对所述权重进行优化。
[0009]可选的，所述奖励包括当前收益和延时收益，所述以最大化所述环境的奖励为学习目标，对所述权重进行优化包...

【技术保护点】

【技术特征摘要】
1.一种数据融合方法，应用于数据融合系统，所述数据融合系统用于按照权重融合多个传感器采集的检测数据，其中，所述方法包括：为每个所述传感器采集的检测数据赋予初始的权重，得到融合数据；将所述数据融合系统作为智能体，所述融合数据作为所述智能体的动作，所述数据融合系统应用的场景作为环境，在所述环境下所述智能体的观测为状态进行强化学习；以最大化所述环境的奖励为学习目标，对所述权重进行优化。2.根据权利要求1所述的数据融合方法，其中，所述奖励包括当前收益和延时收益，所述以最大化所述环境的奖励为学习目标，对所述权重进行优化包括：获取在所述环境下处于当前状态和下一状态的所述目标属性I的费雪尔信息；利用处于所述当前状态和所述下一状态的所述目标属性I的费雪尔信息，确定执行所述动作的当前收益；利用执行所述动作的当前收益计算执行所述动作的奖励，对所述权重进行优化。3.根据权利要求2所述的数据融合方法，其中，所述利用处于所述当前状态和所述下一状态的所述目标属性I的费雪尔信息，确定执行所述动作的当前收益包括：在处于所述下一状态的目标属性I的费雪尔信息大于处于所述当前状态的目标属性I的费雪尔信息的情况下，执行所述动作的当前收益为处于所述下一状态的目标属性I的费雪尔信息。4.根据权利要求2或3所述的数据融合方法，其中，所述利用处于所述当前状态和所述下一状态的所述目标属性I的费雪尔信息，确定执行所述动作的当前收益还包括：在处于所述下一状态目标属性I的费雪尔信息不大于处于所述当前状态目标属性I的费雪尔信息的情况下，执行所述动作的当前收益为0。5.根据权利要求1所述的数据融合方法，其中，其中，a
t
为所述动作，s
t
为当前状态，s
′
为下一状态，r
t
为执行所述动作的当前收益，γ为折现因子，δ为学习率，Q(s
t
，a
t
)为在所述环境处于所述当前状态...

【专利技术属性】
技术研发人员：黄安付，
申请(专利权)人：白杨时代北京科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人